来源:HIT专家网 作者:姜浩 根据录音整理
如今,医疗大数据已成为驱动智慧医院建设的关键因素,然而在如何才能更好地发挥医疗大数据的价值方面,不少医疗机构还面临着许多问题与困难。
“医疗大数据的建设与应用一定要瞄准真痛点、真需求。”在由HIT专家网主办的2021年南湖HIT论坛上,上海柯林布瑞信息技术有限公司(以下简称柯林布瑞)联合创始人秦晓宏在演讲中分享了他的见解。
以“非接口”方式突破医疗大数据平台的建设痛点
“一家三甲医院往往面对着数百个异构系统、数十个系统厂商,如果医疗大数据平台的建设必须依赖厂商配合、改造接口的方式来获取业务数据,这条路是不通的。”秦晓宏表示,这是医疗大数据平台在建设过程中面临的最大“痛点”之一。
为此,柯林布瑞在构建医疗大数据平台时,始终坚持一个理念:即在不需要对任何业务系统进行接口改造、不影响业务系统正常运转的前提下,从业务系统数据库底层中抽取和同步数据,进而建设大数据平台。
如何才能够进行“非接口”前提下的异源异构数据整合?柯林布瑞提供的解决方式是:针对实时数据,医疗大数据平台通过CDC(Change Data Capture,变化数据捕获)同步数据,基于日志捕获技术实现实时增量数据的同步;针对离线数据,通过异构数据源离线同步工具DataX,实现跨平台、跨数据库的不同系统之间的数据同步,支持SQL Server、Oracle、MySQL等数据库的离线同步。通过CDC及DataX实现全量的“热”数据中心。
经过多年的技术经验积累,柯林布瑞目前拥有超过500多种HIS、EMR、LIS等业务系统异构数据的整合能力,无需与业务系统厂家进行对接,即可识别各种医院信息系统中的数据结构,数据整合无需对业务系统进行接口改造,更不产生任何接口费用,帮助医疗机构突破这一建设痛点。
智慧医院对医疗大数据的“真需求”
在建设智慧医院的过程中,医院运营管理、临床诊疗、科研教学等环节对于医疗大数据的应用分别提出了不同的需求。秦晓宏表示,这些需求正是医疗大数据平台应用的发展方向。
在运营管理方面,医疗大数据平台需要对医院运营管理数据进行挖掘分析,让医院实现科学化、智能化管理。柯林布瑞提出数据驱动智慧管理的几个关键,一是指标统一管理,既往的做法是根据不同的需求开发不同的指标,数百个指标混杂在一起,管理难、核对难、应用难;必须对医院的指标进行统一的定义管理,将指标来源、口径等定义清楚。二是结合公立医院评审及公立医院绩效考核,对指标的计划、预警、改善、结果进行过程管理,不能仅仅进行指标的展示。三是运营数据挖掘技术,从数据中挖掘出管理问题,给出管理建议。
在临床诊疗方面,需要医疗大数据平台一方面对临床诊疗数据进行整合串联,为诊疗工作便捷化提供直观的数据展现;另一方面需要结合临床的业务场景,找到真痛点、真需求,为医护人员提供智能的预警与建议。秦晓宏表示,在构建智慧医疗场景时,要以医生在临床诊疗过程中所遇到的需求与困惑为出发点,以患者获益为最终目标。
比如:柯林布瑞设计研发的静脉血栓栓塞症(VTE)智能防控系统,实现了患者住院全流程自动评估。平均每位患者VTE评估管理可节省医护人员4小时的工作量,VTE风险评估率从46.14%提高至93.22%,评估模式由单次患者评估转为住院全程评估。
秦晓宏介绍说,某医院在上线该系统后,VTE患者平均住院日由15天降为7天左右,显著降低了患者的住院费用。系统可实时识别高危患者并主动发出提醒,使中高危风险患者知晓率由无数据支撑提高至100%,有效地优化了诊疗流程,提升患者自我健康管理能力与认知水平,以及医院对患者服务的延续性。
在科研场景方面,需要医疗大数据平台对科研通用数据元和专科数据元进行定义,需要对数据进行标签化处理、标准化处理、结构化处理,需要为科研医护人员提供数据搜索、统计、挖掘的平台和工具。
柯林布瑞在医疗大数据平台中内置临床大数据搜索引擎,为医生的回顾性研究提供了有力工具。同时,为了保障医院的数据资产不外流,柯林布瑞将数据分析统计挖掘功能内嵌至平台中,医生在医院内部即可实现数据分析、统计、挖掘工作,从而提高科研效率,保障数据资产安全。
面对医院运营管理、临床诊疗、教学科研等环节提出的复杂需求,如何才能通过同一个医疗大数据平台统一满足这些需求?秦晓宏认为,这需要从顶层设计的角度统筹谋划。
据秦晓宏介绍,柯林布瑞医疗大数据平台采用了“4中台(技术中台、数据中台、AI中台、业务中台)+1前台(应用前台)”的整体架构。其中,技术中台位于最底层,包括存储引擎、计算引擎、技术工具及管理工具;其次是数据中台,负责提供数据整合、数据治理等功能;AI中台与业务中台并列于数据中台之上,AI中台负责支撑AI算法、提供计算模型,业务中台负责解决业务系统统一对接等问题;最上层是应用前台,负责提供临床、运营、科研数据中心与应用以及各种基础应用软件。
同时,柯林布瑞医疗大数据平台采用Hadoop和MPP(Massively Parallel Processing,大规模并行处理)混合架构,利用流式实时计算、分布式离线计算等技术,对各类医疗数据进行统一、高性能的汇集与批量处理;通过大数据平台的加工处理,对数据进行分类分层建模,形成统一的数据集市和数据元,为后续的业务分析、机器学习、监控预警提供数据支撑;通过对各类数据进行分析、提炼、碰撞比对,可最大限度发挥数据的医疗价值。
建设数据质量检查支撑体系,直击数据质量“痛点”
“医院大数据平台不能单纯追求数据‘规模大’,更要追求‘质量好’。”秦晓宏特别强调,数据质量问题一直制约医疗大数据平台发展,也是医院信息化发展的“痛点”之一。
要想解决这一“痛点”,就要理清和解决两大问题:
首先,如何判断数据质量的高低?秦晓宏认为,应从一致性、规范性、完整性、关联性、合理性等五个维度出发定义数据质量,确定数据质量管控规则,并在此基础上形成数据质量规则库,同时也根据实际情况不断扩充规则库。目前柯林布瑞医疗大数据平台已涵盖接近3000项数据质量规则。
其次,如何保障与管控医疗数据质量?秦晓宏表示,应建设完整的数据质量检查支撑体系,每天进行数据质量质控报告;通过数据核查PDCA方法论,构建数据质量管理闭环;基于医疗大数据平台,对质量需求和问题进行全质量生命周期管理,包括质量问题的定义、检查监控、发现分析、跟踪反馈及知识库沉淀。
秦晓宏表示,这一方法不仅仅适用于医疗大数据平台,很多医疗机构已将其应用于其他业务系统的数据质量检查。“希望能够借此方法切实提升业务系统数据质量,构建高质量的医疗大数据平台,从而为智慧医院建设提供坚实可靠的数据支撑。”
【责任编辑:秦勉】
评论前必须登录!
注册