来源:HIT专家网 作者:上海交通大学第六人民医院 郑西川
医疗大数据重在数据利用
种种迹象表明,健康医疗医疗大数据的时代正在加速到来。我国是一个人口大国,人口老龄化和各种慢性病发病率的增加,人们对医疗健康服务的要求越来越高,医疗机构也希望通过整合医院内部数据资源实现数据信息驱动临床科研,提升临床科研决策支持水平,医疗大数据分析应用对医院临床信息化建设的促进作用越来越明显。
一般意义的大数据具有数据量大、增长迅速、结构复杂、价值高以及密度低等特点,大数据需要用创新的方法和技术进行处理。而医疗大数据具有大数据定义的全部特征:医院临床3D影像和组学数据加速数据指数增长;为了支持转诊和区域EHR, 区域医疗信息共享数据呈几何级数增长;便携式可穿戴医疗检测设备,实时监测产生动态数据,传统的关系数据库管理系统已难以管理;临床信息数据类型复杂,既包括记录型的结构化数据(EHR/EMR)、纯文本或PDF格式的非结构化和半结构化文档数据,也包括DICOM格式的影像数据以及新型组学数据;同时医疗对数据的要求高:诊疗数据要求质量高,错误率低;要求数据处理及分析方法精准;医疗数据隐私保护比其他行业要求更高。
为了实现不同临床信息系统数据共享,需要建立医院信息集成平台。近年来,国内相当一批综合性医院已经建立了以信息集成平台为核心的电子病历应用和临床数据中心(CDR),将原来分散在各个临床业务系统的数据集中整合。它不仅包括病人历史数据,医疗仪器所产生的病人影像数据,心电以及各类仪器设备所产生的波形数据(时态数据),还包括病人的基因组学数据;经过组织数据中心病人临床信息数据就是医疗大数据。信息集成平台重要方向是建设医疗大数据分析平台,医疗大数据重在数据利用,如何在大数据中挖掘出有价值的知识,利用这些知识为病人临床医疗服务,是电子病历应用的全新使命和重要任务。
医疗大数据分析平台建设
建设医院临床大数据分析平台,综合各种数据建模、挖掘评估技术,发现临床诊疗规律,支持医疗决策和医学科研,是目前医院临床信息集成共享的重点工作。医院临床信息系统产生的各种业务数据,需要通过合适的数据预处理、数据分析,建立相关业务预测模型,应用这些模型对临床业务进行流程改进、效率提升。将数据分析应用与业务流程,如在医院电子病历应用中使用实时统计分析、预测预警,对病人就诊行为、药物临床效用分析等,往往能得到意想不到的效果。
医疗大数据分析平台的总体架构如图1所示。它集成个医院临床信息系统的数据,经过转换清洗,以分布大数据的存储模型实现了非结构化数据存储架构,经过各种挖掘分析模型和相关分析,实现分析挖掘;对医院业务系统提供即时动态信息服务,提升医院信息系统帮助临床医生医疗决策和管理者管理决策的水平。与传统临床数据中心相比,基于大数据的分析平台采用了非结构化关系数据存储和处理技术,在数据存储上,采用如Hadoop等分布式非结构化、半结构化的数据存储物理架构,在数据分析挖掘方面,采用相关分析、图表评估等分析方法,特别在数据的可视化与挖掘算法模型提供了一系列新的创新模型和算法,适合于非结构化数据处理。
医疗大数据分析平台建设涉及诸多关键技术,其中共性技术有:数据安全病人隐私保护、海量数据采集与信息融合技术等,突出医疗数据特色的关键技术包括以下两个方面:
一是影像数据分析技术。对于具有重要临床价值的医学影像,通过专病影像库、特征库、特征索引等方式,对影像病灶特征进行提取分析,与病人实时影像相比对,辅助影像医生读片效率提升,提高医技报告准确率。图2是医疗大数据分析平台中医学影像分析技术的示意图。医学影像大数据挖掘分析也使特定疾病大规模计算机筛查成为可能,有利于医院临床科研水平提升。
二是对非结构化自由文本数据的分析。医院电子病历中包含大量的非结构化自由文本信息,医疗大数据分析中的自由文本挖掘分析主要通过临床文档分析引擎建立医学文本特征库和术语库,通过专业特征词汇库,不断迭代更新,使电子病历医学术语更加符合临床医生习惯,实现关键词汇分类,语义上下文分析,进而达到临床文档的理解,通过大数据文本分析,辅助医生临床电子病历质量控制,提升医院电子病历质量水平。图3是医疗大数据分析平台的自由文本数据分析技术的示意图。
如何利用医疗大数据平台
我国医院医疗信息化经过近20年发展,临床电子病历应用取得长足进步。从基于模板的文档编辑到以医嘱为核心的临床流程电子病历应用,综合性医院在电子化医嘱、临床路径、抗生素管理以及移动医疗等方面取得重大进展。目前医院电子病历应用正处于信息化转型时期的关键节点,电子病历应用中,临床知识库建设明显不足,导致了医院电子病历应用个性化不够,支持医生临床决策明显不够。医疗大数据分析平台为动态实时地利用和完善临床知识库奠定了基础,同时也为智能电子病历建设创造了良好条件。
在临床信息化建设初期,电子病历应用比较重视流程操作性信息系统的投入,实现了基于流程的医嘱驱动信息化应用,目前分析决策性数据利用信息系统应用不足。其他行业(特别是金融、股票等)都具有适时的可视化报表系统,医疗卫生行业是一个典型的需要数据综合和展现的行业,其报表需要可交互的仪表盘数据展现,提供定制化功能以适应不同用户,产生与基准目标的数据对比,以及历史趋势分析。图4是电子病历应用中临床数据综合报表,基于临床数据中心的各种可视化展现为临床信息利用提供了新方案,国内各医院在电子病历应用中,纷纷嵌入患者临床视图、管理者驾驶舱以及医护数据门户等反映了数据驱动电子病历应用的趋势。
临床电子病历以及数据采集的电子化使得数据分析应用越来越普及,通过分析能够跟踪病人的临床流程,从而改进医疗缺陷。医疗数据分析导致了“数据科学家”的崛起,数据分析参与了电子数据解释、分析和管理流程改进过程,将电子化数据转化为有意义的信息特别重要。临床数据分析能够改善病人医疗质量。临床数据与面向过程的数据不同,可能包括遗传数据以及临床记录,这往往是更难进行大规模的数据分析,数据可用性和质量是临床信息系统面临的重要问题。
对医疗大数据进行层次分析,形成临床知识规则,服务电子病历应用,达到临床应用智能化,是医疗大数据利用和电子病历应用的重要目标,也是今后电子病历应用的方向和必然趋势。图5是典型的智能问诊咨询机器人的方案示意图,通过大数据知识库以及病人的详细病症档案,实现患者的问题咨询和问诊,同时能对医生的诊断和治疗提供补充建议。随着医学人工智能技术发展,类似的临床信息应用会越来越普遍。
结束语
电子病历应用面临医疗物联、区域共享、移动闭环等新任务,需要借助于大数据平台及相关技术,提升电子病历应用的智能化水平;电子病历发展方向是临床知识库的建设,实现智慧化精准医疗,大数据分析是提升电子病历应用质量的辅助手段; 医疗集成平台(临床数据中心)建设重要方向是建立临床大数据分析应用平台。
医院数据临床中心建设需要借助大数据技术和基础架构,建设包容、共享的病人临床信息平台,支持国家、地区健康信息标准,实现医院临床信息系统数据采集和信息服务。临床电子病历应用是一个长期的任务,智能化是临床信息化的重要方向。在目前各种新观念新技术不断涌现的实现,医院临床信息化仍需坚持“以数据为基础,以智能为目标,以病人为中心,以临床为核心,以医嘱为主线”,坚持信息化为医疗质量和病人安全服务的理念,提升医院数据中心的建设质量。
作者简介
郑西川,男,教授级高工。1965年元月生,硕士研究生学历,任上海交通大学附属第六人民医院计算机中心主任。
上海交通大学医学院生物医学工程专业硕士研究生导师,苏州大学放射医学与公共卫生学院生物医学工程专业硕士研究生导师。中国医院协会信息管理专业委员会 (CHIMA)委员;中国医药信息学会(CMIA)委员;上海市医院协会信息管理专业委员会委员;中国医药信息学会上海分会常委;中国生物医药技术协会医药信息分会常委;《医疗卫生装备》杂志特约审稿专家。研究方向:①基于PACS电子病历的临床信息共享;②HL7/XML电子转诊相关技术及应用研究;③ 区域临床信息共享及协同医疗信息技术研究;④数字化医院的相关标准及实现技术。
近年来,先后承担上海市“十一五”重大科技项目、上海市科委自然科学基金项目、上海市经济信息委信息化专项基金以及院级课题多项。发表论文40余篇。
评论前必须登录!
注册