专业咨询
致力推进中国医疗卫生信息化

【CHIMA2020】顾卫红医生:做罕见病领域的连接者

来源:HIT专家网    作者:谭啸

中国国家罕见病注册系统(NRDRS)总协调人、中文人类表型标准用语联盟(CHPO)总协调人顾卫红博士

“大多数罕见病病种为遗传病,疾病表型信息与基因数据的连接存在诸多障碍。罕见病表型数据很难标准化,但必须要经过这一关,才能将分散的孤岛信息和数据有序汇集起来。”在CHIMA 2020“医疗大数据与人工智能”分论坛上,中国国家罕见病注册系统(NRDRS)总协调人、中文人类表型标准用语联盟(CHPO)总协调人顾卫红博士发表了题为《罕见病注册系统的建设、管理与表型数据标准化》的演讲。顾卫红博士长期从事罕见病、遗传病的临床诊疗、基因分析、患者教育、科学普及、相关行业连接等工作。

罕见病数据碎片化

顾卫红博士首先介绍了罕见病的基本情况:罕见病是医学与社会学的综合概念,包含复杂而宽泛的问题,本质上是医学问题。罕见病约等于疑难病,包括7000余种疾病,种类还在不断增加。罕见病范畴的疾病名称多样,分类交叉,很多病种存在临床表型变异,病因和发病机制十分复杂,尚存在大量未知数。罕见病诊断困难,很多患者长期辗转各地就医,难以获得明确诊断,误诊、漏诊情况常见,大多数罕见病目前缺乏针对性治疗方法。

罕见病患者散居各地,其就医过程通常需要六个步骤:(1)导诊和诊前准备;(2)找到专业临床资源;(3)遗传病类型需要做基因检测明确病因;(4)遗传咨询和医学建议;(5)有效干预,如药物、手术、生殖干预等;(6)患者管理,包括:患者注册、随访管理、开展临床试验等。

顾卫红博士谈到,罕见病数据具有以下特征:(1)整体来讲,罕见病数据碎片化,难以标准化,罕见病信息采集周期长,各种环节和场景复杂多样,患者的临床资料、基因数据和社会信息分散在各处,存在大量信息孤岛。(2)罕见病难以做流行病学调查,患者分散,诊断困难。

针对上述这些问题,亟需建立国家级罕见病注册平台,有序汇集可靠数据,提高数据采集和汇集的效率。需要做好如下相关工作,才能真正形成闭环:合理设计注册系统基础框架;逐步建立表单、用户、群组管理规范流程;逐步建立数据质控标准和规范流程;相关环节加强培训。

中国国家罕见病注册系统

顾卫红博士介绍了中国国家罕见病注册系统(National Rare Diseases Registry System of China,NRDRS),依托国家重点研发计划精准医学专项“罕见病临床队列研究”,由北京协和医院负责建设的国家级罕见病在线注册平台,总负责人是北京协和医院张抒扬教授。NRDRS的建设目标是:确立统一的罕见病注册标准和规范,联合全国罕见病研究的优势单位,形成罕见病研究协作网络,在全国范围内开展患病率相对较高、疾病危害较大的罕见病注册研究,推动我国罕见病临床诊疗能力提升,达到国际先进水平。“罕见病临床队列研究”项目由北京协和医院牵头,包括20个参加单位,分别承担5个子课题。

中国国家罕见病注册系统首页截屏

一年前,顾卫红博士成为中国国家罕见病注册系统(NRDRS)总协调人。目前,NRDRS系统已升级到2.0版本。NRDRS V2.0主要功能是收集注册队列数据,同时收集、更新注册用户信息和表单档案,建立群组档案,在数据录入、存储、质控、实时统计、管理和安全方面形成闭环。“这是一个随着系统升级逐步实现的过程,不断打磨完善各个环节,同时把各个环节串连在一起,形成内环。在此基础上,开展病例管理、队列管理、用户管理和群组管理,这是外环。”顾卫红博士说。

NRDRS网站目前包括8个部分内容:第一批罕见病目录疾病(知识库)、已注册疾病(病种列表和注册病例总数)、项目进度(周报)、罕见病注册系统2.0、NRDRS登记病例分布地图(实时更新)、学术成果、相关简讯、罕见病知识库链接。

截至2020年8月22日,共有82个机构205位研究者参与注册,启动注册队列185个,注册病例共计56907例。顾卫红博士介绍,“罕见病注册队列群组将是NRDRS着力发展的模式,注册队列群组组长为具有相应临床专业资质的PI(Principle Investigator,学术带头人),在相关专业领域具有一定影响力,负责群组病例数据的医学质控,同时提高注册队列数据的完整性。”

罕见病表型数据缺乏标准

“罕见病表型数据非常多样,很难标准化。”顾卫红博士谈到,大多数罕见病病种为遗传病,疾病表型信息与基因数据的连接存在诸多障碍。

随着基因测序技术的飞速发展,获取基因数据越来越便捷,但与之对应的表型信息的采集效率严重滞后。基因数据是结构化的,表型数据则具有多样性和复杂性特征,很多还存在模糊性的特点。临床医学的发展具有很长的历史,疾病的命名、分类多样交叉;很多疾病存在表型变异性,不同医生对于患者表型的描述存在差异;患者个体的不同病程阶段表型变化,会受到各种环境因素的影响;医疗信息和健康数据多种来源,增加了不确定性。基因数据的获取及其分析流程需要不断完善:大量基因变异的意义尚不明确,参考数据库需要逐步升级完善,逐步积累证据以分析变异与疾病的关系,人类对于基因组结构和功能的认识不足,还有大量的未知数。

“因此,细致可靠的临床表型信息的采集和记录至关重要,需要不断积累基因数据,不断优化参考数据库,并基于互联网平台连接数据。”顾卫红博士表示,“在这一过程中,需要找到共同语言建立连接。”

人类表型术语是有效的连接工具

人类表型术语(Human Phenotype Ontology,简称HPO),旨在提供人类疾病中用于描述表型异常的标准词汇,每个术语描述一种表型异常。HPO建立者利用从医学文献、Orphanet、DECIPHER和OMIM数据库获得的信息进行开发,并持续维护、更新、开发和完善。HPO项目包括三大组成部分:表型词汇、疾病表型注释及计算算法。自2008年首次发布以来,HPO在覆盖面、范围和数据库复杂度方面都在不断扩大提高,比如:从罕见病扩展到常见(复杂)疾病、开展表型驱动的基因组研究、诊断的新算法、与哺乳动物表型词语集整合、患者能够理解和应用的“门外汉”通俗描述。

“HPO是连接的工具,在相关专业人员、表型与基因数据、个体数据与数据库之间建立连接。”顾卫红博士进一步谈到,医生获得的个体表型信息大多是多样、模糊的,基因检测机构获得的个体基因序列变异数量多、意义未明,HPO可以成为医生和基因检测/遗传分析专业人士之间的共同语言,将个体表型信息和基因数据与疾病知识库/数据库进行有效连接。

HPO是基于真实世界数据建立的术语体系,便于直接用于真实世界数据的连接,HPO已成为连接遗传病表型与基因数据的主要术语体系,被广泛应用于罕见病、遗传病知识库、数据库、病例注册系统的基础框架,对于建立和完善罕见病、遗传病临床决策支持系统(CDSS)至关重要。

在我国,目前国内大部分医疗、科研工作者所使用的表型描述词语缺乏统一标准,临床表型数据大多为非结构化自然语句,亟需探索建立表型数据采集和录入标准,建立数据质控规范流程,精准连接表型数据与基因数据,提高数据分析效率。为此,在中文人类表型标准用语联盟的倡导下,启动了中文人类表型标准用语(Chinese Human Phenotype Ontology,CHPO)项目,据顾卫红博士介绍,CHPO是一个专业公益项目,旨在建立全国开放平台,联合临床、遗传咨询、分子生物、医学数据等相关领域专业人士,对HPO进行翻译,并根据中国医生的专业用语习惯进行编辑,逐步建立中文临床表型术语标准,从而支持中文使用者的临床和科研工作。

CHPO网站首页截屏

CHPO项目作为中国医学表型标准化基础建设之一,历时近5年,建立了wiki网站(http://www.chinahpo.org/wiki)和搜索引擎(http://www.chinahpo.org),不断优化更新,连接OMIM数据库并对OMIM疾病名录进行翻译校对,与HPO团队保持连接,跟进HPO更新词库,开放CHPO词表下载。迄今共有近300位专业人士参与贡献,超过100个机构或项目组申请下载CHPO词库。未来希望联合更多专业同道,共同推进中国医学表型标准化进程,并为国际医学术语体系的发展做出贡献。

“CHPO将助力NRDRS的发展,推动建立中国国家罕见病注册系统疾病表型术语标准,开展注册队列疾病表型与基因相关性研究,建立NRDRS与相关知识库和数据库的连接。”顾卫红博士最后用8个字进行了总结:连接、协调、合作、共进。

关注HIT专家网微信订阅号
精彩不容错过!

【责任编辑:谭啸】

赞(5)

评论 抢沙发

评论前必须登录!

 


未经允许不得转载:HIT专家网 » 【CHIMA2020】顾卫红医生:做罕见病领域的连接者
分享到: 更多 (0)