专业咨询
致力推进中国医疗卫生信息化

【郑西川专栏】困扰电子病历数据临床研究的三个问题

来源:HIT专家网 作者:郑西川

国内医院电子病历应用经过多年努力取得了很大进展,临床业务基本实现了信息化,医院临床数据中心(CDR)积累了大量患者的临床数据。然而,单纯的临床业务信息系统并不能随着数据量增加而为用户“自动”提供新知识。目前电子病历数据二次利用和大数据分析需求日益强烈,将电子病历数据应用于临床研究中,形成高质量临床研究成果,对医院信息化发展意义重大。

临床数据是医院进行科研分析的金矿,但拥有数据并不等于拥有黄金。本文讨论电子病历数据进行临床研究面临的三个问题与可能的解决方案。

问题一:临床数据分散需要集成整合

1.数据孤岛问题国内医院电子病历应用水平评级促进了临床业务系统的互操作能力。按照电子病历评级规定,三级以上应用水平都要求具有基本的临床信息集成能力,临床数据互联互通共享协同基本能够实现,特别是临床数据中心基本解决了业务系统数据共享互通需求。另一方面,临床科研需要关注医疗设备器械的数字化接口问题,例如患者生理参数监测设备每天产生大量数据,由于不同器械设备由厂家独立开发,各种临床设备产生的监测数据集成整合需要设备接口标准以及生产厂家协作,同时医院临床器械种类繁多,生产年代处于不同时期,数据接口不规范,导致临床科研人员不得不为患者生命体征数据记录的整合付出大量劳动。

2.数据标准化问题各种临床数据在不同语义语境中的一致有效性也存在问题。原因是不同信息系统的设计目的不同,数据采集时的术语语义并不一致,需要进行临床数据治理。建立临床概念术语框架体系,对概念术语进行系统分类,对术语概念进行匹配等,是数据集成的基础工作。目前医院电子病历已经有多种术语代码标准体系,例如国际疾病编码ICD、系统化临床医疗术语SNOMED、观测指标标识符逻辑命名与编码系统LOINC等标准体系,医院在电子病历临床应用中应大力推进标准化术语体系应用,在目前临床数据标准化程度不高的情况下,医院临床科研平台需要根据具体问题,做好相关术语概念的对照映射,提升临床电子病历数据标准化质量。

3.患者数据隐私保护问题。《数据安全法》《个人信息安全保护法》等法律法规明确规定要切实保护消费者的个人信息安全,医院临床科研数据要充分考虑患者隐私数据保护问题。在电子病历应用中,通常将患者数据储存在私密受限位置,只有经过权限审批的人员才能访问数据;临床研究数据需要对患者标识进行去隐私处理,包括删除和修改某些数据信息,以达到既不影响科研需要又能保护患者隐私的目的。 

问题二:数据准确性不能满足临床研究要

患者电子病历数据包括:实验室报告指标数据、医疗设备实时监测的患者生理数据、患者费用数据、医疗过程中各种医嘱以及电子病历记录的文本数据。这些临床数据进入科研数据库时,需要对数据质量进行评估与数据预处理。

从数据准确性角度,可将问题数据分为三类:错误数据、缺失数据以及不精确数据。

错误数据指在临床科研中不能置信的数据。不可信数据的移除是重要一步,可以通过算法标识出错误数据并进行去除。如在医疗器械信息采集中,可以通过算法对实时动态波形信号中明显偏离正常的数值进行识别,予以剔除。

缺失数据数据缺失是数据分析中常见问题,医院临床信息系统中存在大量数据缺失。导致数据缺失的原因是随机的,如实验室检测设备故障无法为患者测量服务,某些数据项不适合患者身份或者不愿填,由于某种原因护士遗漏评估某些患者状态等。对于这类数据,可根据具体情况采用忽略、手工填写、算法自动填写三种处理方法。 

不精确数据主要是临床业务系统中概念不一致造成的,需要在源头上进行解决,不断提高医院业务系统的术语概念一致性,培训医护人员提高临床数据采集质量。

问题三:临床数据不能满足科研数据模型复杂性

临床研究往往是从具体临床问题出发的,核心是在研究问题引导下建立数据组织分析模型。临床研究的类型多种多样,例如在疾病诊断模型中,往往需要一个参考标准来独立诊断疾病,针对具体的临床问题希望有预后预测模型等。而医院临床业务信息应用中并没有现成的此类数据信息,需要结合其他数据信息,如患者随访信息、生物医学样本信息等。将这些信息与医院电子病历应用数据有机融合,与相关分析模型一起构成医院临床科研信息发展的数据基础。

在临床科研数据架构中,不仅涉及常规电子病历数据,也涉及非结构化高通量临床信息数据,需要采用大数据技术方法进行处理。这些数据包括:(1)自由文本信息挖掘,针对患者临床大量的文本记录,运用NLP技术可以提升对疾病预测的准确性。(2)动态影像、音频等时态数据处理。(3)基因数据,包括患者基因组学数据和基因表达数据。

面对多源、高通量、多模态临床科研数据需求,信息工作者在与临床研究者、统计分析以及生物分析人员协同的同时,要充分利用数据挖掘、机器学习、AI分析等技术手段,提升医院临床信息处理能力。

总结

临床数据分析信息系统与临床业务信息系统的建设目的不同,电子病历数据需要经过数据整合、转换、清洗等前处理阶段,才能用于临床研究;对电子病历数据重新组织,建立课题数据模型,适应临床研究课题设计架构,是电子病历数据二次分析的关键。

同时,医院临床科研中要注重电子病历数据与生物医学样本、患者基因生物信息数据的融合,实现临床业务数据的科研转化,发挥电子病历数据潜力和价值。

目前医院信息化正在跨越数据化,向知识提供和临床决策支持发展,临床研究也朝着真实世界数据研究转向。医院信息工作者应当充分利用这一契机,为临床科研提供信息技术支撑,在发展临床科研信息化的同时,不断提升医院临床电子病历的应用水平。

【作者简介】

郑西川,上海交通大学附属第六人民医院计算机中心教授级高工。上海交通大学医学院生物医学工程专业硕士研究生导师,苏州大学放射医学与公共卫生学院生物医学工程专业硕士研究生导师。中国医院协会信息专业委员会(CHIMA)委员,中国医药信息学会(CMIA)委员,上海市医院协会信息管理专业委员会委员,中国医药信息学会上海分会常委,中国生物医药技术协会医药信息分会常委,《医疗卫生装备》杂志特约审稿专家。

研究方向:①基于PACS电子病历的临床信息共享;②HL7/XML电子转诊相关技术及应用研究;③区域临床信息共享及协同医疗信息技术研究;④数字化医院的相关标准及实现技术。近年来,先后承担上海市“十一五”重大科技项目、上海市科委自然科学基金项目、上海市经济信息委信息化专项基金以及院级课题多项。发表论文40余篇。

此图片的alt属性为空;文件名为HIT%E4%B8%93%E5%AE%B6%E7%BD%91%E8%AE%A2%E9%98%85%E5%8F%B7.png
关注HIT专家网微信订阅号
精彩不容错过!
寻求“商务合作”请扫码填写需求
我们将尽快与您联系!

【责任编辑:秦勉】

赞(2)

评论 抢沙发

评论前必须登录!

 


未经允许不得转载:HIT专家网 » 【郑西川专栏】困扰电子病历数据临床研究的三个问题
分享到: 更多 (0)