专业咨询
致力推进中国医疗卫生信息化

北医三院计虹:让数据驱动医院科研高质量发展

来源:HIT专家网  供稿:海森健康

“大数据科研应用带来了一个意想不到的效果——提升临床采集的数据质量。很多医生在科研过程中发现数据质量不好,根本原因在于源头的电子病历质量存在问题。只有促进病历采集源头的质量,再辅之以AI病历质控,才能有效提高数据质量。”

4月23日下午,在2021中华医院信息网络大会(CHINC)的“基于数据驱动的智慧医院建设”论坛上,北京大学第三医院(简称:北医三院)信息管理与大数据中心主任计虹发表题为《大数据共享利用支持科学研究实践》的演讲,介绍了该院如何利用大数据技术支持科研发展、建设研究型医院的实践。

从应用型向研究型迈进

计虹主任谈道,医院数据的一大特点是非结构化数据占比高,高达80%左右,医院面临着获取数据难、文本利用难等问题,而且人工分词效率低、二次转录易出错。

当前,医院已进入数字化、大数据时代,医院系统众多,产生出的海量医疗数据完全具有大数据的特征:种类多、传输快、数量大、价值高。获取到数据后,要基于人工智能、自然语言处理(NLP)等技术对数据进行后结构化处理和数据利用。

医院中广泛存在的异构数据面临着诸多问题,如:多库分离,异构数据分散;医院多时期数据不一致;无法跨库关联;无法在线查询全量数据;数据质量差等。

据介绍,目前北医三院的全量数据中心(HDR)已积累了10年的病历数据,包括45种文书、4800万份病历、937万份检查报告。“只有充分利用深度学习、NLP、数据挖掘、知识图谱等人工智能技术,才能发挥出海量数据的优势。”计虹表示。

“当前,北医三院的信息化建设正在从应用型向研究型迈进发展。”计虹主任介绍了北医三院信息化建设的发展历程:

  • 2008年开始电子病历建设,是国内首批规范化电子病历应用医院;
  • 2015年,建设CDR数据中心,数据中心已汇集近百个业务信息系统的21亿条数据;
  • 2017年建立全量大数据中心(HDR),采用AI机器学习、大数据等技术,实现大数据分析等功能;
  • 2019年开始数据应用建设,在全院推广科研平台,实现科研深度应用,提升研究产出建设;
  • 2020年开始向研究型医院发展,建设研究型病房,作为国家级医疗中心、国家级质控中心,探索研究型医院建设。

探索基于大数据的新型科研模式

计虹主任对比分析了传统研究模式和基于大数据的新型研究模式,在发现问题、提出假设、数据获取等环节,均可依托智能化医疗数据中台,利用荟萃分析、探索性分析、数据查询等方法,对传统研究模式进行改进和优化。

大数据科研整体架构包括五层,从下到上依次是:数据采集、数据治理、数据模型、安全和数据应用。其中,数据治理包括标准化建设、数据处理、数据质控和数据转化;数据模型包括基础模型(疾病模型、文档模型、症状模型),融合模型(知识图谱、时间序列、患者画像),挖掘模型(诊断推荐、鉴别诊断推荐、治疗方案推荐等);数据应用包括智能分析平台、专病库、多中心研究、智能随访、药物临床试验等。

计虹主任尤其提到了数据集建设体系,数据整合是很痛苦、很复杂的,要依据标准化数据元进行规范和建模;并在此基础上,建设大数据智能应用平台。

大数据平台成为临床科研的有力助手

“所谓‘建管用’,最终的落脚点是‘用’。”计虹主任强调,她重点介绍了如何利用大数据平台为临床科研提供有力帮助。

北医三院临床大数据智能研究平台具有全链条数据归集利用、数据整理统一展示、数据质量追溯、多中心数据管理等功能,已成为临床科研的有力助手。2020年7月,北医三院的《双引擎驱动智能化辅助临床诊疗》入编由国家卫生健康委组织编写的《医疗健康人工智能应用案例集》。

将大数据用于专病研究时,系统可进行实时、连续、完整、可追溯的全息数据展现,具备患者持续管理、患者画像特征分析、数据溯源核查、专病数据分析、研究热点自动挖掘、真实世界建模等功能。

在单体医院之上,还可基于专病队列库建立多中心专科联盟,形成多中心数据共享平台,整合不同医院的专病资源,扩大样本量,从而有效减少地域特征导致的患者特征偏倚。

大数据驱动下的临床研究管理能形成“数据从临床中来、最终反哺临床”的闭环,基于大的人群队列去挖掘科学问题,再开展前瞻性RCT(随机对照试验)验证,最终将研究成果转化至临床,指导临床实践。

最后,计虹主任表示,数据利用是一项长期的系统工程,目前还面临着数据规划、数据质量、安全机制、数据处理、人员有限等诸多挑战,要持续优化与改进,最终实现让数据驱动科研高质量发展的目标。

关注HIT专家网微信订阅号
精彩不容错过!

【责任编辑:秦勉】

赞(4)

评论 抢沙发

评论前必须登录!

 


未经允许不得转载:HIT专家网 » 北医三院计虹:让数据驱动医院科研高质量发展
分享到: 更多 (0)