来源:HIT专家网 记者:陶玲
北京嘉和美康信息技术有限公司副总经理、技术总监 陈联忠
“大数据不是替代医生做科研,也不是替代传统统计分析人员的工作。提供大数据平台就是改变以前科研工作的方式。” 近日,在由中国研究型医院学会医疗和临床科研大数据专业委员会主办、HIT专家网承办的“医疗大数据应用与实践研讨会”上,北京嘉和美康信息技术有限公司副总经理、技术总监陈联忠结合该公司的在大数据领域的最新应用进展,分享了关于大数据应用降低临床科研壁垒的经验。
医疗大数据是一个跨学科的综合性应用。医院从管理、临床到科研都涉及大数据应用。与此同时,不少医疗IT服务企业在不断吸收医院需求,很好地消化大数据技术,为国内医疗机构提供便利的应用工具和产品,助力大数据真正在医疗机构落地。陈联忠表示,利用大数据不仅可以提高科研效率,而且实现数据可视化后,能更加直观地展现疾病治疗、诊疗现象,帮助设计、完善研究结论,提高科研产出效果。
医疗科研存在四大壁垒
当前,大多研究型医院都将科研放在了较高的战略地位上。但现状却是,临床科研当中的数据利用存在重重障碍,亟待打破各种无形的数据壁垒。
大型医院的医务工作者,除了要完成常规医疗工作外,还要肩负强度很高的科研任务。陈联忠表示,研究型医院的科研主要有三个方面任务:基础研究;通过临床验证,将科研转化为实质性的临床诊疗技术;以及将这些科研成果应用加以推广。
对于医生来讲,无论是知名大专家还是基层的普通医务工作者,临床专业、影像专业、生物样本、基因测序等都需要科研。尽管临床工作已经很忙碌,但临床科研也是必不可少的,所以再忙再累也得挤出时间用于科研上,这是别无选择的。究其原因有三方面:一是科研能够证明临床技术水平;其次,承担申请科研项目基金时,科研能力是重要的砝码;第三,良好的科研水平可以展现自身的学术地位。
据介绍,现在临床科研主要的框架分为选题、执行和总结。这其中有很多壁垒制约科研成果产出的效率。陈联忠分析说,医疗科研的数据壁垒有四方面:
最大的壁垒是对临床假设的验证。医务工作者在诊疗过程中会遇到很多值得研究的问题,但是大多不知道怎么聚焦、着手。此外,当确定一个课题后,医务工作者很难确定样本量是否足够。而没有足够样本支撑的科研,从统计学角度来讲是没有意义的。
第二个壁垒:获取临床数据的壁垒。目前大多数科室还在利用Excel表或单机版小程序手工来收集科研数据。造成这种状况的原因是首先是获取病历相关数据的流程复杂,临床做科研的流程一般是先提出需求和样本过滤条件申请,到科主任、院领导审批,再到信息科导数据、到病案室借病历;其次,拿到的病历达不到可以直接使用的数据粒度,仍然要再花费大量的人力和时间从既往病案中“刨数据”,而且有可能拿出来的数据并不符合当初期望的结果。所以,从时间、空间上来看,临床科研使用这些数据有很多不方便之处。医疗数据离临床是如此之近,用起来却是那么遥远。临床数据天天都在增加,项目在不断变化,面对庞大、复杂的临床数据,传统的这些科研数据收集手段显得力不从心。
第三个壁垒:病案数据和科研数据互通的壁垒。
病历是临床资料的载体,是科研数据的重要来源。病历大多数由低年资医生书写,往往在科研使用过程中发现数据不全或感觉记录的不确切,加之上述获取临床数据的壁垒,导致做科研的高年资医生自己组织团队单独收集科研数据,但按照国际科研论文的刊发要求,科研数据是要能溯源的,独立收集的科研数据往往不能溯源,因此往往很难发表高影响因子的学术论文。而病历逐步变成仅用于病案检查,内容缺乏有效的检查,价值偏低,这也是目前网上说的病历内容很多是garbage的原因。
第四个壁垒:分析数据的壁垒。临床医生的专业是临床医学,往往不熟悉医学统计学。如果要做科研,需要新学习很多专业性很强的统计学工具以及编程技巧。所以单靠医务工作者自己来做数据分析费时费力,结果也并不理想。
大数据科研平台让医生更专注于研究
临床科研是个比较繁杂的过程,怎样节省中间环节让医生能够有更多时间专注于研究?怎样借助目前的大数据资源让医生能够高效地获得高质量的临床数据?怎样帮助医生实施数据分析?怎样协助临床医生消除科研壁垒、高效利用临床数据?陈联忠认为,大数据工作中的数据维护、可行性验证、数据采集、数据清洗、数据锁定、数据分析等,都可以作为工具来帮助开展临床科研工作。
用大数据来解决科研壁垒的前提是,医院信息化的进展程度以及大数据技术的成熟度。目前,国内大多数数据公司或厂商都是采用已有的成熟、开源的技术手段来解决问题,整合产品。现在医院信息化也进入到了一个比较好的阶段,从业务系统的完善到数据中心的建立,实现了数据的高效收集,为大数据应用奠定了良好基础。此外,云存储等新技术的革新也大大降低了我们存储数据的成本。这为大数据工具的应用奠定了良好的基础。
首先,利用大数据技术可以把临床非结构、结构化数据加工组合成可用于计算的数据粒度,让临床使用数据触手可及。
其次,可以利用已有大数据技术和已有数据的特征分析、相关分析,协助临床医生进行科研问题的提出和假设,进行临床科研选题,优化目前临床科研的研究模式。“爱因斯坦曾说,发现一个问题比解决一个问题更重要。以前大多都是临床医生依据自己的经验先提出问题再验证。这种模式会走弯路,因为基于经验的问题往往不可靠。而现在是在数据分析的基础上发现问题,这样问题就有了数据支持,让课题更能持续进行下去。”陈联忠说。
再次,可以提供辅助分析工具,让数据得到及时的分析。在整个研究过程中可以基于阶段数据分析预测产出结果,实现科研数据质量的环节质控,避免到课题结束时才最终做一次统计分析的风险。
总之,随着大数据科研平台的建设,将极大地改变研究数据获取方式,并在医学研究的很多重要环节上帮助科学家们提高科研效率和质量;依托大量的规范化临床数据资料,利用数据分析、数据可视化等技术,能够更加直观地展示疾病诊疗现象,从而帮助科学家提出创新的科学问题和假设;能够随时提供大量的数据帮助科学家去设计、完善研究方案,形成研究结论,从而提高成果产出效率。
嘉和美康具有3年实时数据中心数据整合经验(数据集成和标准化经验)、5年Hadoop相关技术实战应用经验、7年临床科研产品经验(大型科研流程实际经验和整体科研解决方案)、16年临床业务系统经验;同时,大数据团队核心成员具有丰富的大数据项目经验、高校研究伙伴技术支撑、临床知名科研团队业务支撑和优秀的医院研发基地,这些都是嘉和美康在短时间内推出大数据科研平台相关产品的坚实基础。
处理多种类数据 满足未来科研需求
大数据科研平台的建设,使得临床数据触手可及,打通了病历和数据利用的壁垒,更多的临床病历数据可以被更广泛的医务人群直接使用,这样会大大提高数据质量的关注度,从而反过来推动源头的临床信息系统(如电子病历等)的深度应用。
在涉及隐私问题上,陈联忠认为,从科研现状来看要区别看待。在院内,数据的使用权限是严格受到医务管理要求的,课题等等都是要明确到患者的,因此权限问题系统提供由医院来设定。对于大样本、数据共享、数据专题分析等数据交换时,会对暴露的数据严格地进行隐私处理。
大数据科研平台不仅仅支撑文本数据的处理,还包括影像、生物样本、基因测序、组学数据等大量临床研究的相关数据,未来基于“MDT”(Multiple Disciplinary Team,多学科综合治疗)模式的科研合作,大数据科研优势会更明显。
【责任编辑:谭啸】
评论前必须登录!
注册