专业咨询
致力推进中国医疗卫生信息化

医院CIO关于大数据的真心话

yanqihu

来源:HIT专家网          记者:朱小兵

医疗大数据的科研一定是面向临床应用;研究型医院必须掌握大数据分析的能力;数据还是存在医院,科研分析不宜束缚过多。这才是医院CIO们对于医疗大数据的真心话。

当下,医疗大数据公司如何定义?达到什么标准才是大数据公司?数据如何脱敏、是否需要设定访问权限?数据共享、数据存储在哪里?医疗大数据应用的实时性是否必要?大数据科研与临床需求之间的关系?7月15日上午,雁栖湖畔,约20家来自北京市各医院的信息主管围绕一系列关于大数据的“基本问题”各抒己见。中国研究型医院学会医疗信息化分会医疗大数据和临床科研专业委员会(以下简称:医疗大数据专委会)在此举行了为期半天的医疗大数据技术应用沙龙。

hengfanxiu 医疗大数据专委会主任委员、北京大学肿瘤医院信息部主任衡反修

医疗大数据专委会主任委员、北京大学肿瘤医院信息部主任衡反修表示,此次专题小活动旨在紧密结合医院需求实际,深入探讨医疗大数据的技术创新和需求实现。他感慨:当下无论是传统的医疗IT公司,还是互联网背景的公司,都宣称在做医疗大数据。但总体看,目前都还没有太多实质性的产出。与此同时,临床对于医疗数据的意识已经全面觉醒,主动的需求越来越多。

大数据科研最终一定是面向临床

解放军总医院计算机室主任刘敏超认为,关于数据的应用共享,我们最终目的是应用,是为临床服务。科研问题归根溯源是临床问题。没有脱离临床问题。科研就是为了解决临床。可能一个结论还用不到临床,是因为没有研究透彻。大数据科研,一定是面向临床。刘敏超进一步认为,大数据研究要解决一个终极问题——提升医疗机构的科研能力。这是有远见的做法。即把目标落实在知识管理上,把专家经验挖掘出来成为产品。尽管目前如何去实现也许还没有答案,但这是必然的方向。

对于医院的实际需求,北京嘉和美康信息技术有限公司副总经理陈联忠深有感触:临床对于大数据的理解是有差异的。一般大数据科研平台,都希望把数据清洗的速度做得比较快,但实际需求是:医生更希望对群体的数据获取比较方便,发现群体共性特征,让医生感受到,不仅可以提供他们想要的变量,还有群体分析。比如,这些分析可能对于构思医学研究问题十分有意义:有人认为颈椎病的相关性疾病是高血压,可能有20%以上的颈椎病人伴随有高血压。而流行病学的研究表明,一般人群的平均高血压就是20%。因此,这就排除了两种疾病的相关性关系。所以,科研和临床沟通,感觉相关性很好。特别是一些科研的参考值出来之后,可以帮助临床排除一些假设。

3个月前,张琨加盟春雨医生并担任CEO。从医院信息部门转战互联网医疗后,张琨发现“医疗数据都是以应用为主导。”他介绍,春雨医生是基于业务场景来做数据的利用,比如春雨服务的人群有很大一部分与皮科有关,患者上传照片后在线问诊。春雨医生将数据积累起来做了一个皮科的辅助问诊系统。“因为医生问诊有一些程序化的问题,把这些问题做成问诊小机器人,放在云端,简化了医生的工作。”张琨说,“医学的科研方法往往有严格的要求,这是临床医生的痛点。建议开展临床科研可以招聘一些流行病统计学方面的人才。由公共卫生背景的人才提供规范的研究方法,医生负责提出科研思路。”

研究型医院要具备大数据的能力

刘敏超说:“为什么医院要搞大数据?因为研究型医院,必须最终掌握技术。我们现在不具备大数据分析的能力,但是我们的目标是具备这个能力。企业应该帮助医院建立这个能力,和医院开展合作。大数据人才很难找,但是我们想清楚了,医院现在大部分是小数据。从小数据利用开始培养团队,不必着急。

北京协和医院信息管理处常务副处长朱卫国表示:同意王晖处长在3月18日会上的观点,没有大数据技术的公司,不能叫大数据公司。有些数据,不采用大数据技术,也能轻松解决;而有一些数据,是传统的技术解决不了或解决得不够好,需要采用大数据技术。比如,门诊量、费用,这些数据用传统的技术就能做。但也有一些查询,一查就死机,用传统技术也能解决,但是很费劲,而用大数据就能很快解决。所以,如果是新瓶装旧酒,不值得提倡;新瓶装以前装不下的酒,值得提倡。

北大人民医院信息中心副主任王力华介绍,通过参与临床科室做一些小课题,发现信息部门和临床的在思维上的一些差异。比如,病例样本的选取。信息部门认为,只要将规则、条件定义好就可以提取数据。但是临床会提供一个病例的列表,这是科室记录传承下来的一些有价值的病例数据。然后信息部门再通过按规则提取的结果进行比较,发现提取的结果比科室提供的列表数量多得多。临床对这个提取结果也认可,但是也会标注其中少量不符合要求的结果。

陈联忠介绍,为了帮助临床更全面地获取数据,需要对患者数据进行整合。基于语义的医学自然语言分词处理技术,帮助实现从标签分词到语义分词。同时,引入机器学习,实现新词发现功能,丰富语料库的建设。而把很多疾病、症状的模型,输入到数据库,形成知识图谱,也是目前临床科研一体化的典型应用。此外,嘉和美康还研制了临床科研一体化工具,一最开始像百度一样,搜索出很多数据,但是临床医生问这些能干什么?于是,他们又做了调整,通过输入条件把更有针对性的结果找出来。比如,患者招募,通过各种方式导入数据,找到一个样本人群。在此基础上,临床可以做很多次模型统计,可以选不同的变量做分析,根据医生的需要可以配置。

主要数据一定存在医院,开展研究不能束缚太多

刘敏超认为,医疗数据的处理,从安全角度肯定要脱敏,而且要有访问权限。凡是在授权范围,允许看、随便用,但是不能带走数据,数据肯定是存放在医院,科研的结论可以带走。做大数据研究,涉及很多方面,不能限定太多

朱卫国也赞同数据需要设定访问权限。但是,他也表示,太多的权限,限制了思维。所以,审计功能很重要。“医学很难出现,一是很难标准化。第二,医疗数据的覆盖面是否全。一旦不全,就出问题。数据放在医院,信息部门也要有危机感,因为信息中心需要有专人负责,信息中心要掌握相应的能力。这就需要公司在赋能最终用户的同时,同时赋能信息部门。”朱卫国说。

王力华也认为,医疗数据一定要脱敏,数据要保留在信息中心。临床往往需要看明细的数据,包括隐私数据。因为临床需要看哪些数据有用,哪些没用。如果全部对医生脱敏、对大数据公司脱敏,可能会导致不能得出符合临床需要的结果。王力华表示,大数据、AI的课题,需要三方面人员紧密配合、各自分工:信息中心、大数据公司、临床人员。信息中心负责抽取原始数据,保证数据质量,开展数据管理和数据脱敏。临床科室负责课题设计、数据抽取目标、报告撰写;大数据公司负责人工智能标注、建模等。

国家卫生计生委统计信息中心评价调查处张耀光副处长说:“统计学有一个规律,数据以小为美。现在,好像被颠覆了。后来接触到医院后,我们接手了各种数据,放在一起,但是什么也没有分析出,还是要回到传统分析方法,先把数据的标准化、质量做好。我们现在有一个数据是一个数据,有一个变量是一个变量,小的数据还是能解决问题。”

大家一致认为,目前国家关于医疗数据的标准、质量、法律法规等配套要求,目前都十分欠缺,这将严重掣肘大数据的应用。

会上,EMC公司还介绍了其超融合架构解决方案。以前,IT基础设施往往来自不同厂家,各自独立,配置过程非常繁琐。超融合架构通过软件定义的方式,对服务器、网络等进行统一管理,大大简化了建设和维护过程,让用户更加专注于业务应用。比如,华东某大型三甲医院PACS采用其ILISON分布式IT架构解决方案,即便更新软件或扩容存储,都不需要重新划分文件卷。而假设几个节点同时损坏,数据也不会丢失。

(本文根据现场发言不完全记录整理,未经本人审阅)

【责任编辑:封诚】

赞(0)

评论 抢沙发

评论前必须登录!

 


未经允许不得转载:HIT专家网 » 医院CIO关于大数据的真心话
分享到: 更多 (0)