【CHIMA2020】顾卫红医生：做罕见病领域的连接者

来源：HIT专家网作者：谭啸

*中国国家罕见病注册系统（NRDRS）总协调人、中文人类表型标准用语联盟（CHPO）总协调人顾卫红博士*

“大多数罕见病病种为遗传病，疾病表型信息与基因数据的连接存在诸多障碍。罕见病表型数据很难标准化，但必须要经过这一关，才能将分散的孤岛信息和数据有序汇集起来。”在CHIMA 2020“医疗大数据与人工智能”分论坛上，中国国家罕见病注册系统（NRDRS）总协调人、中文人类表型标准用语联盟（CHPO）总协调人顾卫红博士发表了题为《罕见病注册系统的建设、管理与表型数据标准化》的演讲。顾卫红博士长期从事罕见病、遗传病的临床诊疗、基因分析、患者教育、科学普及、相关行业连接等工作。

罕见病数据碎片化

顾卫红博士首先介绍了罕见病的基本情况：罕见病是医学与社会学的综合概念，包含复杂而宽泛的问题，本质上是医学问题。罕见病约等于疑难病，包括7000余种疾病，种类还在不断增加。罕见病范畴的疾病名称多样，分类交叉，很多病种存在临床表型变异，病因和发病机制十分复杂，尚存在大量未知数。罕见病诊断困难，很多患者长期辗转各地就医，难以获得明确诊断，误诊、漏诊情况常见，大多数罕见病目前缺乏针对性治疗方法。

罕见病患者散居各地，其就医过程通常需要六个步骤：（1）导诊和诊前准备；（2）找到专业临床资源；（3）遗传病类型需要做基因检测明确病因；（4）遗传咨询和医学建议；（5）有效干预，如药物、手术、生殖干预等；（6）患者管理，包括：患者注册、随访管理、开展临床试验等。

顾卫红博士谈到，罕见病数据具有以下特征：（1）整体来讲，罕见病数据碎片化，难以标准化，罕见病信息采集周期长，各种环节和场景复杂多样，患者的临床资料、基因数据和社会信息分散在各处，存在大量信息孤岛。（2）罕见病难以做流行病学调查，患者分散，诊断困难。

针对上述这些问题，亟需建立国家级罕见病注册平台，有序汇集可靠数据，提高数据采集和汇集的效率。需要做好如下相关工作，才能真正形成闭环：合理设计注册系统基础框架；逐步建立表单、用户、群组管理规范流程；逐步建立数据质控标准和规范流程；相关环节加强培训。

中国国家罕见病注册系统

顾卫红博士介绍了中国国家罕见病注册系统（National Rare Diseases Registry System of China，NRDRS），依托国家重点研发计划精准医学专项“罕见病临床队列研究”，由北京协和医院负责建设的国家级罕见病在线注册平台，总负责人是北京协和医院张抒扬教授。NRDRS的建设目标是：确立统一的罕见病注册标准和规范，联合全国罕见病研究的优势单位，形成罕见病研究协作网络，在全国范围内开展患病率相对较高、疾病危害较大的罕见病注册研究，推动我国罕见病临床诊疗能力提升，达到国际先进水平。“罕见病临床队列研究”项目由北京协和医院牵头，包括20个参加单位，分别承担5个子课题。

一年前，顾卫红博士成为中国国家罕见病注册系统（NRDRS）总协调人。目前，NRDRS系统已升级到2.0版本。NRDRS V2.0主要功能是收集注册队列数据，同时收集、更新注册用户信息和表单档案，建立群组档案，在数据录入、存储、质控、实时统计、管理和安全方面形成闭环。“这是一个随着系统升级逐步实现的过程，不断打磨完善各个环节，同时把各个环节串连在一起，形成内环。在此基础上，开展病例管理、队列管理、用户管理和群组管理，这是外环。”顾卫红博士说。

NRDRS网站目前包括8个部分内容：第一批罕见病目录疾病（知识库）、已注册疾病（病种列表和注册病例总数）、项目进度（周报）、罕见病注册系统2.0、NRDRS登记病例分布地图（实时更新）、学术成果、相关简讯、罕见病知识库链接。

截至2020年8月22日，共有82个机构205位研究者参与注册，启动注册队列185个，注册病例共计56907例。顾卫红博士介绍，“罕见病注册队列群组将是NRDRS着力发展的模式，注册队列群组组长为具有相应临床专业资质的PI（Principle Investigator，学术带头人），在相关专业领域具有一定影响力，负责群组病例数据的医学质控，同时提高注册队列数据的完整性。”

罕见病表型数据缺乏标准

“罕见病表型数据非常多样，很难标准化。”顾卫红博士谈到，大多数罕见病病种为遗传病，疾病表型信息与基因数据的连接存在诸多障碍。

随着基因测序技术的飞速发展，获取基因数据越来越便捷，但与之对应的表型信息的采集效率严重滞后。基因数据是结构化的，表型数据则具有多样性和复杂性特征，很多还存在模糊性的特点。临床医学的发展具有很长的历史，疾病的命名、分类多样交叉；很多疾病存在表型变异性，不同医生对于患者表型的描述存在差异；患者个体的不同病程阶段表型变化，会受到各种环境因素的影响；医疗信息和健康数据多种来源，增加了不确定性。基因数据的获取及其分析流程需要不断完善：大量基因变异的意义尚不明确，参考数据库需要逐步升级完善，逐步积累证据以分析变异与疾病的关系，人类对于基因组结构和功能的认识不足，还有大量的未知数。

“因此，细致可靠的临床表型信息的采集和记录至关重要，需要不断积累基因数据，不断优化参考数据库，并基于互联网平台连接数据。”顾卫红博士表示，“在这一过程中，需要找到共同语言建立连接。”

人类表型术语是有效的连接工具

人类表型术语（Human Phenotype Ontology，简称HPO），旨在提供人类疾病中用于描述表型异常的标准词汇，每个术语描述一种表型异常。HPO建立者利用从医学文献、Orphanet、DECIPHER和OMIM数据库获得的信息进行开发，并持续维护、更新、开发和完善。HPO项目包括三大组成部分：表型词汇、疾病表型注释及计算算法。自2008年首次发布以来，HPO在覆盖面、范围和数据库复杂度方面都在不断扩大提高，比如：从罕见病扩展到常见（复杂）疾病、开展表型驱动的基因组研究、诊断的新算法、与哺乳动物表型词语集整合、患者能够理解和应用的“门外汉”通俗描述。

“HPO是连接的工具，在相关专业人员、表型与基因数据、个体数据与数据库之间建立连接。”顾卫红博士进一步谈到，医生获得的个体表型信息大多是多样、模糊的，基因检测机构获得的个体基因序列变异数量多、意义未明，HPO可以成为医生和基因检测/遗传分析专业人士之间的共同语言，将个体表型信息和基因数据与疾病知识库/数据库进行有效连接。

HPO是基于真实世界数据建立的术语体系，便于直接用于真实世界数据的连接，HPO已成为连接遗传病表型与基因数据的主要术语体系，被广泛应用于罕见病、遗传病知识库、数据库、病例注册系统的基础框架，对于建立和完善罕见病、遗传病临床决策支持系统（CDSS）至关重要。

在我国，目前国内大部分医疗、科研工作者所使用的表型描述词语缺乏统一标准，临床表型数据大多为非结构化自然语句，亟需探索建立表型数据采集和录入标准，建立数据质控规范流程，精准连接表型数据与基因数据，提高数据分析效率。为此，在中文人类表型标准用语联盟的倡导下，启动了中文人类表型标准用语（Chinese Human Phenotype Ontology，CHPO）项目，据顾卫红博士介绍，CHPO是一个专业公益项目，旨在建立全国开放平台，联合临床、遗传咨询、分子生物、医学数据等相关领域专业人士，对HPO进行翻译，并根据中国医生的专业用语习惯进行编辑，逐步建立中文临床表型术语标准，从而支持中文使用者的临床和科研工作。

CHPO项目作为中国医学表型标准化基础建设之一，历时近5年，建立了wiki网站（http://www.chinahpo.org/wiki）和搜索引擎（http://www.chinahpo.org），不断优化更新，连接OMIM数据库并对OMIM疾病名录进行翻译校对，与HPO团队保持连接，跟进HPO更新词库，开放CHPO词表下载。迄今共有近300位专业人士参与贡献，超过100个机构或项目组申请下载CHPO词库。未来希望联合更多专业同道，共同推进中国医学表型标准化进程，并为国际医学术语体系的发展做出贡献。

“CHPO将助力NRDRS的发展，推动建立中国国家罕见病注册系统疾病表型术语标准，开展注册队列疾病表型与基因相关性研究，建立NRDRS与相关知识库和数据库的连接。”顾卫红博士最后用8个字进行了总结：连接、协调、合作、共进。

【责任编辑：谭啸】

【CHIMA2020】顾卫红医生：做罕见病领域的连接者

评论抢沙发

评论前必须登录！

相关推荐

最新发布

业界招聘

社区新帖

最新评论

标签云

链接表

HIT180客服

关注微信：hit180
复制微信号

回顶部

评论 抢沙发