专业咨询
致力推进中国医疗卫生信息化

开放与共享:医疗大数据利用无法回避的命题

来源:HIT专家网    记者:朱小兵  实习记者:王方怡

在“2016北京卫生信息技术协会学术年会”上,中国医学科学院医学信息研究所李姣博士进行了题为《医学领域开放数据的挖掘与运营》的发言,分享了国内外健康医疗大数据的行业经验和前沿信息,令在座嘉宾深受启发。

中国医学科学院医学信息研究所李姣博士

中国医学科学院医学信息研究所李姣博士

国外政府开放数据研究

李姣表示,其所在团队主要关注开放数据对医学科学研究的作用,为此团队观测了不同国家所开启的开放数据、开放政府等一系列行动。李姣介绍,从2011年起,美国、英国、巴西等8个国家先后发布了开放政府的协议,成立了开放政府联盟。从各个国家政府开放数据的情况来看,英美的开放程度较高。

“在数据的开放共享中,需要考虑两个因素:一要考虑开放数据的易用性;二要考虑对象数据的鲜活性,即持续更新性。而政府开放的数据,对于新的业态发展和行业创新来讲,是非常有意义的。”李娇表示,在美国所开放的政府数据中,与医疗保险相关的CMS数据占56%,排名在第一位;而在英国开放的数据中,排名在第一位的是占18%的由健康与社会保健中心发布出来的跟健康科普相关的科普教育信息。

事实上,数据在进行开放之前需要进行认证和风险评估,其中包括了技术层面、法律层面、社会影响等各环节。在内部经历严格的认证和审核流程后,开放共享出来的数据也可能已经过加密和脱敏处理。随后,李姣具体介绍了数据开放流程:“首先需要为每一个数据集指定唯一的身份标识,即ID号;其次要通过第三方机构对其进行风险评估,确定其是否可以开放共享;再次,再由第三方机构对其进行价值评估。”

李姣还说道,大数据需要建立一个好的平台,一个好的原生态系统,可以对数据进行更好的管理,能够知道哪些数据需要进行深度挖掘,哪些数据需要建立共享模式,让更多人去利用这些数据。

通过大数据分析促进精准医学发展

在介绍了国际上健康医疗大数据的研究经验后,李姣简要介绍了其所在团队目前正在进行的相关研究。首先是数据引用的挖掘工作,即如何指导由大的科研计划支撑的科研产出被另外的科学家使用,具体就是从医学文件当中进行文本挖掘,找到开放的数据集被另外的研究团队进行了哪些挖掘,并进行具体分析。

另外,团队还需要从基因的层面,研究如何把疾病和治疗药物的研发进行紧密的联系。李姣表示,运用目前的网络建模挖掘、非结构化文本的挖掘等技术进行相关研究工作,将在癌症治疗、个性化用药当中起到关键性的作用。在此基础之上,李姣同其所在团队还尝试与世界上不同的研究团队协同采取轨迹评测的方法,从临床试验的角度验证研究结果。

同时,为了更好地理解中国老百姓所关心的健康问题,李姣同其团队还开展了中国网络互动健康术语的挖掘工作,关注中国网友在互联网上对于健康信息的表述方式,并对照相应的医用临床术语。

李姣所在团队还承担了国家《精准医学研发计划方向三:精准医学资源整合大数据存储与利用》当中的第三个方向——仅供研究的精准医学知识库的构建。对此,李姣表示,数据挖掘工作更重要的是要从数据转化为知识,而如何存储知识也是一个重要问题。“例如,如何解读数据分析的结果,该结果以什么样的形式来存储和表示,针对这些问题,应该建立一个精准医学知识库,在决策和诊断的时候将发挥重要作用。”李姣说。

在发言的最后,李姣表示,希望能够和在座同仁一起,“在确保患者信息安全的情况下,最大程度开展数据共享,做好数据分析,倡导技术开发,解决社会问题,不断进行创新,推动行业发展。”

赞(0)

评论 抢沙发

评论前必须登录!

 


未经允许不得转载:HIT专家网 » 开放与共享:医疗大数据利用无法回避的命题
分享到: 更多 (0)