专业原创
致力推进中国医疗卫生信息化

【郑西川专栏】发布订阅技术在CDR实时数据抽取的应用

来源:HIT专家网    作者:上海市第六人民医院计算机中心 郑西川

郑西川-特征图

临床数据中心(CDR,Clinical Data Repository)是医院信息化的核心基础设施之一,其建设与实现技术逐渐提到信息化建设的日程。临床数据中心为临床应用提供统一的数据接口,集中存储了分布于各个应用系统的数据,实现数据共享利用服务。

在数据中心建设中,ETL(数据抽取、转换和加载)占有非常重要的地位,各个公司提供了各种各样的ETL工具,这些ETL工具功能较强,但由于与生产系统紧密耦合,使得部署弹性较差,对生产系统性能影响较大,代价较大。而结合发布订阅技术实现数据抽取,能够使数据抽取的灵活性和可扩展性增加,尤其适合数据源涉及多个业务系统的情况。

发布订阅技术原理

发布订阅(Publish/Subscribe,简称Pub/Sub )技术是一种生产系统以发布订阅方式进行数据交互的中间件。在Pub/Sub方式下,生产系统将发布内容发送给发布订阅中间件,Pub/Sub中间件将数据及时可靠地传送给数据消费者。

发布订阅的优点在于,数据生产者和数据消费者在时间、空间以及控制流三方面完全被解耦,能够很好地应用于大规模、高动态的分布式系统数据共享需要,这种技术早期已有成熟产品在银行、证券以及企业信息化等数据集成共享中得到利用。

在临床信息系统发展过程中,各个系统信息孤岛使得临床信息数据标准成为一个难点,医院信息互联互通及相关应用成为信息化建设的关键。信息集成平台以及数据中心的建设近年来为实现互联互通提供了契机。发布订阅技术应用可以将生产系统的改造降到最低,为CDR中信息数据与业务系统实时同步提供了一种技术实现途径。

实现方法

在传统的ETL数据抽取方法中,ETL是在数据生产端实现的,这种方法实现简单,技术上容易实现,但其具有如下缺陷:

(1)数据的抽取、清洗和转换都在数据生产端进行,导致生产业务系统压力过大,影响业务系统的性能;

(2)数据源数据随着ETL直接进入数据中心数据库,导致每个数据源都要有一个ETL过程,在数据源增加时,ETL会变得复杂,在对应多个数据中心主题数据时,会使ETL显得力不从心。

发布订阅中间件的主要功能是:向生产系统索取数据,向订阅者发布数据。可以根据数据源情况,采用不同的方式进行数据发布订阅,如全表采集、定期轮询以及增量发布等实时和非实时方法,具体实施可根据业务系统数据情况确定方案。

结论

基于发布订阅技术实现临床数据中心与医院业务系统数据同步,能够减少数据抽取转换过程对业务系统的影响,增加临床数据转换、清洗过程的灵活性和可靠性,同时也使临床数据中心的数据更加可靠、及时,在医院业务系统局部出错时候能更快地恢复,保障了数据中心的强壮性。

发布订阅技术用于临床数据中心建设中的数据抽取,与其他ETL技术相比更加灵活,降低了业务生产系统与数据中心的耦合度,使得医院临床信息集成变得简单易行,有效地避免了业务系统大幅度的修改,避免了生产系统数据库的差异,适合多数据源大规模数据抽取,为CDR建设提供了比较可行的方法。

【作者简介】

郑西川,上海交通大学附属第六人民医院计算机中心主任、教授级高工。上海交通大学医学院生物医学工程专业硕士研究生导师,苏州大学放射医学与公共卫生学院生物医学工程专业硕士研究生导师。中国医院协会信息管理专业委员会 (CHIMA)委员;中国医药信息学会(CMIA)委员;上海市医院协会信息管理专业委员会委员;中国医药信息学会上海分会常委;中国生物医药技术协会医药信息分会常委;《医疗卫生装备》杂志特约审稿专家。

研究方向:①基于PACS电子病历的临床信息共享;②HL7/XML电子转诊相关技术及应用研究;③ 区域临床信息共享及协同医疗信息技术研究;④数字化医院的相关标准及实现技术。

近年来,先后承担上海市“十一五”重大科技项目、上海市科委自然科学基金项目、上海市经济信息委信息化专项基金以及院级课题多项。发表论文40余篇。

【责任编辑:谭啸】

赞(0)
未经允许不得转载:HIT专家网 » 【郑西川专栏】发布订阅技术在CDR实时数据抽取的应用
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!