来源:HIT专家网 作者:朱小兵 陶玲
“宇宙起源于奇点的大爆炸。这也是我们以生命奇点为公司命名的原因。她寓意我们相信医疗大数据能够为未来的医疗健康服务带来深远的变革和影响。”悄然辞去北大医疗信息技术有限公司CEO职位一年半后,刘立宇带着他的创业团队在广州以“大数据助推精准医疗”沙龙的形式浮出水面,并且在活动开场辞中如是介绍新创建的这家公司的名字——生命奇点。
2015年7月,三位分别来自医疗信息化领域、广告大数据领域、生物信息领域的北大校友,雄心勃勃地投身到精准医疗、大数据创新领域,创建生命奇点(北京)科技有限公司(以下简称:生命奇点)。创始团队几乎触及了现今关于医疗大数据领域每一个躁动的“敏感点”,不仅有临床信息、生物信息学和云计算专家,还拥有多位国际知名学者担当智力支持。
2016年的中国,从大数据研究角度切入,有关精准医疗的创业团队呈现星火燎原之势,生命奇点的独特之处何在?
打造学习型医疗系统:从大数据获取洞察力
把临床数据、生物信息和统计、实验室和分子检测数据、大数据和人工智能技术、云计算等多个学科领域融合在一起,从数据中获取洞察,助推临床和科研,是生命奇点的愿景和初心。
生命奇点的创业理论思路来源于公司的高级顾问石瑜教授在美国范德堡大学成功构建精准医学大数据中心的实践经验以及美国医学研究所提倡的学习型医疗系统。
生命奇点CEO刘立宇介绍,传统医疗体系中,临床对规范和指南的应用都是一种单向应用模式,即:从科学研究—临床验证—临床应用,在实际临床应用过程中积累的信息没有被很好地利用起来。在临床研究领域,证据等级较高的证据主要来源于RCT(Randomized Clinical Trial)试验(随机临床对照实验),但RCT最为临床所诟病的一点就是耗时、样本规模相对小。美国临床肿瘤学会研究表明参与RCT研究的患者案例只占所有病人群体的3%-4%,这意味着剩余96%-97%的病人是“被代表”了。其实,不同病人对同一种药、同一种治疗方法的反应很有可能是不一样的。“因此,传统的RCT研究需要真实世界研究来补充和提升个性化应用。”刘立宇说。
为此,美国医疗研究所提出并推广学习型医疗系统。该系统的核心理念有点类似于PDCA(Plan-Do-Check-Action,计划-执行-检查-纠正)的概念。即临床医疗的证据数据来自于整个临床到基础研究的过程,其中所有的数据都被采集下来,进行海量数据分析,从中产生更多的证据。再结合严格的RCT数据去论证这些证据信息是否有用,最后反馈回临床,进一步规范和指导临床行为。简单来讲就是将医院沉淀下来的各种数据加以充分利用,挖掘其有用价值来提升临床、科研和医院管理。
学习型医疗系统的应用在国外已有不少成功案例。比如:美国盖辛格医院、范德堡医学院附属医院、佛罗里达州坦帕市的莫非特肿瘤中心等,都是通过学习型医疗系统和生物医学大数据中心将大量的临床数据、生物标本、基因组学数据进行整合应用于科研和临床。“精准医疗、个性化医疗最核心的内容是精准分型。”刘立宇说,有了精准分型才能做到精准预防、精准筛查和精准诊断。通过学习型医疗系统的理论支持,生命奇点将自身模式定位为:从大量真实数据中发现规律、线索,再用非常严谨的类似RCT的方法去验证其更多的应用价值。
今年年初,生命奇点公司牵手天津医科大学肿瘤医院成立了全国首家“肿瘤精准医学大数据中心”。该中心致力于通过对海量肿瘤样本数据进行分析研究,探索发现与中国人密切相关的肿瘤早期诊断的标志物,为肿瘤早期筛查、诊断和药物研发提供科学依据,为患者提供有针对性的个性化诊疗服务。
用字当头:帮助临床医生用好数据
精准医学现在是国内外医学研究领域的大热点,但生命奇点团队更看重生物医学信息在临床上的应用。
刘立宇说:“信息爆炸以后,医护人员可以通过不断学习变得业务精通,但让医生将所有的信息全部记在脑袋里,这是不可能的。”
有研究报告表明,到2020年,医生对于一个疾病的认识,分子生物学相关的信息将占到80%以上,影像学、症状、解剖学等知识信息只占了20%。因此,结合了临床指南和真实世界数据的大数据平台对医生的临床决策支持是必不可少的。同时,这种大数据平台不仅仅是单个医院独享,还应该实现不同医院的资源共享,让多家医院结合起来变成联盟,通过众筹的方式实现数据共享,产生更大的效益。
刘立宇表示,要做好大数据平台面临三个方面的挑战:第一,医院能不能做到生物标本、数据统一管理,有没有统一、标准的操作规范,能否建立数据模型,将不同医院、科室的数据进行整合;第二,能否让原始临床数据变成可供科研分析的有效数据;第三,医院之间和各个科室之间需要建立良好的激励、共享机制,真正实现数据共享。
面对上述三大难点,生命奇点在借鉴国际成功经验的基础上,结合自主创新,为医院和学科联盟打造精准医学大数据中心,为其提供从规划到落地的全程解决方案。其架构包含了生物标本库、实验室、生物信息、临床信息、生物统计、大数据分析。
生命奇点精准医学大数据中心架构的底层是业务系统,中间层是采用开源架构的技术平台、知识库,顶层是科学研究、临床学知识和医院管理应用。该平台的核心价值有四方面:数据宝藏、科研利器、临床助手以及科研-临床的完整解决方案。
其中,数据知识库并非单一的文献资料,更多的是从临床数据中挖掘出来的有价值信息。主要包含整合医院非结构化的临床资料和海量的分子生物数据,同时链接各种数据库和文献资料库,可对临床信息和生物数据进行实时查验,形成支撑临床实证分析的“宝藏”。在科研支持方面,可以通过系统将医院原有的文本病历数据转化为标准化和结构化的电子数据,并对数据进行统计、分析,得出有临床意义的信息,反馈给临床,支撑临床科研和临床医疗。此外,整个大数据系统平台还建立起体系化的精准医学临床规范和知识库,基于大数据为精准临床医学决策提供支持。
利用真实世界的数据快速验证,增强临床科研能力
刘立宇认为,虽然涉猎大数据的行业众多,但是医疗大数据与其他行业的大数据相比有特殊的地方。医疗大数据需要更多维度、更高质量、更长时间的持续跟踪。这就给临床试验带来了成本高、周期长等挑战。生命奇点的思路是,利用真实世界的数据,对医生提出的假想进行快速验证,在此基础上再决定是否启动一个完整意义的临床科研项目。
受到美国范德堡大学(Vanderbilt University)定量科学中心、基因组学分析和研究中心主任石瑜(Yu Shry)教授的启发,再结合中国的实际情况,生命奇点着眼于科学研究、临床决策支持、医院管理,开发出了以软件产品为主的Vitark系统。
Vitark一词源于拉丁文,vita意思是生命,ark是方舟。Vitark系统不仅整合了医院的数据,包括患者信息、临床数据、病理及生物数据、影像数据、实验室检查数据以及患者的长期随访数据,还把各种临床和生物信息资料库、指南以及文献资料库等多维度数据和医院数据相关联,为临床医生提供强大的机器学习、数据可视化工具和数据探索工具,构建基于人工智能技术的学习型医疗体系。Vitark系统既可以做云计算托管,也可以为医院做私有云部署。
Vitark对科研和临床的意义有三个方面:首先,现有的电子病历信息其实是通用的结构,不是专门应用于某一病种或是某一科室的模型。所以,临床数据变为可分析数据之前,必须要经过清洗和结构化。临床病历信息采集后转换成可以用来分析的数据,这是关键点也是难点,期间需要一定知识背景去解决不同学科之间的鸿沟问题,从纯文本中抽取有用信息。其二,利用平台把生物组学和标本信息全部打通,然后用标本来做多组学的开发、解读后进行大数据整合。第三,改变科研进程。传统科研需要先设立一个假想,然后收标本做实验,结果常常是最后发现跟原本设想完全不一样,所以推倒重来再去构建新的假想。这个过程非常耗时、效率较低,研究成果产出少。通过Vitark平台,医生可以非常容易、迅速地先拿到相关数据,结合强大的数据分析工具,建立猜想,确定入组设计和课题思路,快速进行实验验证。这样可以大大提高效率,降低科研浪费,最终能实现“数据-假设-发现-验证-知识”的良性高效流程。
目前,Vitark在医院和学科联盟都有试点应用。其中在科研方面,增强了医院课题申报竞争力,提高了科研产出。同时,Vitark也可以为医院提供新一代临床服务决策支持体系,利用人工智能技术,提供疾病的预测、筛查、诊断、临床干预方法的选择、治疗效果的预测等,从而改进临床规范、降低临床风险、增强面向患者的个性化诊疗水平。
【责任编辑:谭啸】
评论前必须登录!
注册