专业咨询
致力推进中国医疗卫生信息化

顾卫红大夫:架设连接基因数据和疾病表型信息的“标准”之桥

来源:HIT专家网   记者:孙鹏

顾卫红中日友好医院运动障碍与神经遗传病研究中心负责人、CHPO总协调人 顾卫红

“对于HPO/CHPO来说,我们不一味追求完善,首先要在相关方中宣传理念,讲求如何落地,从连接一种种疾病的表型信息和基因数据起步,从落实到一个个具体的患者开始,一边推广,一边完善,让更多的用户参与进来。”在2017年初于杭州举办的以“开放之路,你我同行”为主题的2017开放医疗与健康联盟(OMAHA)第二届会员大会上,中日友好医院运动障碍与神经遗传病研究中心负责人、CHPO总协调人顾卫红大夫如此表示。

HPO(Human Phenotype Ontology)即“人类表型标准用语”,而在此基础上诞生的CHPO即“中文人类表型标准用语”,也可以理解为“中文人类表型标准用语联盟”(Human Phenotype Ontology Consortium)。自2016年初成立以来,在过去一年多的时间里,作为该公益组织总协调人的顾卫红大夫积极奔走、联合各方,做了大量沟通、连接以及项目设计工作,为HPO的本地化建设和进一步落地应用发挥了重要作用。

当前相关领域现状及HPO的临床需求

近几年,基因测序技术飞速发展,助推精准医学的兴起。在遗传病、出生缺陷、肿瘤等疾病的诊断方面,基因数据变得越来越重要,而如何连接、解析临床疾病表型信息和基因数据之间的关系,已成为新的发展瓶颈。

顾卫红大夫认为,HPO可以在疾病表型和致病基因之间起到重要的连接作用,但现阶段两者的连接存在障碍。首先是临床表型信息的采集效率问题,随着二代测序、三代测序等基因测序技术的迅速发展,获取基因数据愈加便捷,成本也不断降低,但与之对应的临床表型信息的采集效率却严重滞后。其次是标准化问题,“人对自然界的认识最开始是‘井底之蛙’,然后是‘瞎子摸象’,这是一个不断趋于明确和无限接近真理的过程。”顾卫红表示,临床具有复杂性和模糊性特点,医学发展的长久历史造成了疾病命名的交叉分类,很多疾病的表型存在变异性,同一个致病基因的突变在不同患者身上表现可能不同。同时,每名医生对患者病情的描述和判断上也存在差异,患者的早、中、后期的病程进展表现也不相同。此外,内外环境因素也都会在不同程度上对表型产生影响。更重要的是,目前的医疗信息的采集和记录缺乏标准化方式,缺乏统一的设计和质控,碎片化严重,具有很大的局限性,而且临床医生与基因机构缺乏交流平台。顾卫红认为,很多时候医生所掌握的个体表型信息多样、模糊,检测机构通过测序获得的个体基因数据变异数量很大。临床表型信息与基因检测数据的有机结合至关重要,需要临床医生和基因机构之间的紧密协作。

“在医学不断发展的过程中,疾病表型与基因之间的关系从模糊到清晰是一个漫长的过程,需要更多相关领域的人士共同参与完善。”顾卫红表示,HPO作为人类表型术语集,所提供的是人类疾病中描述表型医学的标准术语,与其他系统化设计的标准术语集(如LOINC、SNOMED CT等)不同,后者涵盖全面且完整,从层面宽度到深度设计很完善。HPO是源于连接的术语系统,其主要来源为已有的医学文献和数据库对于遗传病/罕见病的表型描述,其优势为可精准地注释疾病,连接表型与基因数据,而目前存在的主要问题为覆盖度亟待完善。

成立CHPO恰逢其时

顾卫红把成立CHPO的原因归结于一次“机缘巧合”,但从行业发展趋势来看,这其实是一种“殊途同归”的必然。

时间回到2015年,当时业内发生了一个知名的基因检测事件——“林林案例”,患儿为疑难性遗传病/罕见病,由于家长是清华校友,所以清华大学生命科学与医学校友会为此发起了一场公益活动,希望相关领域的专家学者以及各个基因检测机构和公司能够参与该公益项目,为“林林”找到真正的病因。彼时国内多家大型基因检测机构和公司都参与其中,免费为患者做全基因组测序、全外显子测序等检测项目。但是,由于各家检测数据均为基因数据,而表型数据为患儿家长所提供,包括长达70多页的临床资料和病理检查结果。经过比对表型信息和基因数据,各家机构或公司所得出的结果均不一致,每家对自己的检测都有不同的解读分析。因此在2015年底,清华大学生命科学与医学校友会再次召集了项目参与方针对该病例组织了一场专题研讨会。在本次研讨会上,参与各方将各自的分析结果进行了讨论和交流。由于长期致力于遗传病、罕见病患者的相关临床和研究及公益,顾卫红作为唯一一名临床医生受邀参加了这次讨论会。

“当时包括遗传咨询、基因检测等各领域的专家一起谈论交流,最终也没有达成共识,无法明确致病基因。但大家共同的体会是,难以将检测出的基因数据与临床表型信息进行对接是其中最大的痛点。”顾卫红表示,当时与会者一致认为,临床表型数据缺乏统一标准,限制了基因数据的分析效率,相关领域迫切需要推动临床术语标准化的落地应用。有专家提出引入HPO,大家一致同意共同推动HPO的本地化推广,“林林案例”也就此促成了CHPO的诞生。

据了解,CHPO的正式成立时间为2016年1月,创建人包括:华大基因团队,王凯(著名生物信息学专家、美国哥伦比亚大学基因组医学所临床信息学主任),张巍(美国医学遗传学会双专科执照认证诊断医师、美国医学遗传学院专家委员),黄尚志(国内知名遗传学家、世界卫生组织遗传病社区控制合作中心主任)以及顾卫红。作为一个纯公益组织,其目的就是为了在中国建立一个开放平台,通过联合各相关领域专业人士,逐步建立中文临床表型术语标准,并让其指导、服务于中文使用者的临床和科研工作。

开放和标准化至关重要

“站在行业发展的角度看,信息数据共享是基础,而标准化是共享和连接的前提,如果没有标准化和共同语言,就不可能建造一个‘通天塔’。”在顾卫红看来,建设一个更为开放和更加标准化的CHPO才能保持长久活力。而利用互联网技术和平台可以让临床表型信息和基因数据在整合、分析、会诊和解读上变得更加有效。

为了对原始翻译进行编辑优化,在王凯等人的努力下,CHPO维基(wiki)网站正式建立,之后顾卫红组织专业人士对词条进行编辑优化,来自海内外的80余位临床、遗传等领域的专业人士参与了这项工作。之后,CHPO维护组建立了CHPO搜索引擎,将CHPO/HPO与OMIM等知识库进行连接,同时提供CHPO词库的免费下载。为了进一步完善和持续发展,CHPO引入张林(LOINC中文版翻译者、LOINC终身荣誉高级会员)和弓孟春(中国医学科学院罕见病研究中心项目办公室主任、国家罕见病注册研究体系执行总监)加入核心组。

为了和HPO保持紧密联络,CHPO还专门设立了联络组,通过邮件和电话会议等方式与HPO进行交流。顾卫红表示:“我们与HPO达成共识,建立了CHPO和HPO网站互链,希望通过连接的方式匹配表型类似的遗传病患者,这对于疾病的基因学研究至关重要。”CHPO专门建立了审核委员会,负责不同分类词汇的中文译名及定义的编辑优化,并计划择期开放注册,从而让更多的专业人士参与到CHPO的编辑工作中。CHPO网站也进行了全新改版,功能更加完善,将CHPO下的指导委员会、维护组、联络组、审核委员会等各部门均设定了词条编辑页面及成员个人页面。“每个成员的工作价值得到了体现,同时也会促进大家更积极地参与和投入到这件事中。”顾卫红说。

据了解,HPO主要分为四类名词,即:表型异常、遗传模式、死亡/衰老以及临床调节因素。其中,“表型异常”是最大的一类名词,分为23大类,其中神经系统异常的词汇有1572条,而最多的骨胳系统达到了3532个词。目前,CHPO取得了阶段性的工作成果,截至到2016年10月,在去除不同分类中的重复词条后,总词条数达到了11896个。也已有超过50个机构和项目组申请下载CHPO词库,包括多家基因检测机构、医院、大学以及相关领域的研究机构。

HPO/CHPO的落地实践

顾卫红表示,目前表型信息与基因数据的连接流程是:医生采集表型信息后,将病历交于检测公司,但是不同医生提供的病历质量参差不齐,之后检测公司将病历中的关键词转化为HPO,检索候选致病基因,在完成基因测序后,经过生物信息和遗传学分析,对变异位点进行初筛,之后将候选致病基因与患者的变异位点相结合进行选点,出具检测报告,并注明“请结合临床”,由医生为患者解读基因报告。“基于医生质量不同且缺乏标准化术语的病历,由检测机构归纳为HPO,这个过程很容易出现偏差。如果能让医生了解、熟悉并使用HPO归纳患者核心表型,提供给检测机构,将有助于提高病历质量,且减少表型信息传递过程中的丢失和偏倚。”顾卫红认为,基因检测用于疾病诊断是开展医疗和健康管理等后续工作的基础。那么到底如何借助HPO这一工具来连接患者表型数据和基因数据呢?

顾卫红认为,由于医疗数据碎片化现象严重,将普通门诊电子病历系统中的相关信息作为结构化的表型数据十分困难,门诊病历录入的聚类查询在管理上也存在一定难度。在目前阶段,无论从专业还是流程方面来讲,建立完善的顶层设计十分困难,需要自下而上从局部进行探索,打通相关环节,之后再逐步复制扩大完善。

首先需要以患者数据为中心去连接临床医生、患者、检测机构和相关的数据机构。”顾卫红如此表示。为此,顾大夫基于自己的专病门诊,与一脉基因合作,共同开发了“运动障碍与神经遗传病专病门诊”表型信息采集电子病历系统。在首页中,除基本信息外,还包括疾病分类以及查询和导出功能。不同于常规的住院病历,该系统收集的表型信息是一种具有针对性的“精准”病历,基于某一类疾病的常见表型设计数据库,通过病史、体格检查、辅助检查等页面采集表型信息。在拟诊页面,设计了核心表型输入方式,通过连接CHPO词库,检索患者的核心表型,从而选取CHPO/HPO关键词。目前正在探索连接基因检测机构,可以将送检的患者表型信息(包括CHPO/HPO关键词)分享给检测机构用户,随后基因检测机构或公司结合分享的资料进行基因数据的初步分析,将结果上传到系统中,临床医生再根据初步的分析结果与患者疾病表型信息进行比对,最后为病人提供最终的基因检测报告。“我们一直在摸索如何把相关信息更好地分享,梳理表型信息与基因数据连接的流程。”顾卫红说。此外,患者可以通过扫描二维码获取病历信息,并打印病历摘要,从而在医疗信息的共享方面也进行了相应的探索。

顾卫红坦言,在推动CHPO本地化应用的过程中,需要建立起包括临床、遗传、生物信息、医学数据等在内的多个专业领域的广泛合作,通过HPO/CHPO将医生获得的复杂多样的表型信息、基因检测机构获得的大量的基因变异数据同已有的知识库和数据库三者之间进行有效连接。“在这个过程中,医生采集患者表型信息转化为HPO,是后续分析工作的重要基础。HPO/CHPO就是为连接而来,所以未来要一直走下去,去探索更多的连接。”顾卫红如此说道。

【顾卫红简介】顾卫红

顾卫红博士,研究员,临床遗传医师,中日友好医院运动障碍与神经遗传病研究中心负责人,CHPO项目(中文人类表型标准用语联盟)总协调人。主持“运动障碍与神经遗传病”专病门诊(联合门诊和精准医学门诊)和分子遗传学实验室工作,开展相关疾病的临床和基因学分析,建立了遗传性运动障碍疾病资源库(临床资料库和DNA库),承担和参与7项国家级和部级科研基金项目,发表学术论文70余篇,参编5部医学专著,长期致力于科研成果转化,以提高疾病诊疗水平。牵头成立中国多系统萎缩研究组(CNMSA-SG),与欧洲多系统萎缩研究组(EMSA-SG)、北美多系统萎缩研究组(NAMSA-SG)日本多系统萎缩研究协会(JAMSAC)建立了密切合作。

目前担任中国研究型医院学会罕见病分会常务理事、中国医师协会神经内科医师分会神经遗传专业委员会副主任委员、中华医学会神经病学分会神经遗传病学组委员、中华医学会北京分会帕金森病与运动障碍学组委员、北京医学会医学遗传学分会常务委员、北京神经内科学会神经变性疾病专业委员会常务委员、北京神经科学学会周围神经与疾病专业委员会常务委员、北京医学会罕见病分会委员、北京神经内科学会认知障碍及相关疾病专业委员会常务委员、中华神经科杂志通讯编委、中华医学遗传学杂志通讯编委、中国现代神经疾病杂志编委、中国罕见病发展中心医学顾问等。积极参与罕见病科普和公益,推动相关医疗和社会体系的建立和完善,力求促进最新科研成果早日惠及患者。

【责任编辑:谭啸】

赞(1)

评论 抢沙发

评论前必须登录!

 


未经允许不得转载:HIT专家网 » 顾卫红大夫:架设连接基因数据和疾病表型信息的“标准”之桥
分享到: 更多 (0)