专业咨询
致力推进中国医疗卫生信息化

北京大学生命科学学院李程研究员:基于基因组学预测药效和联合用药靶点

北京大学生命科学学院李程研究员

 北京大学生命科学学院李程研究员

来源:HIT专家网               记者:陶玲

北京大学生命科学学院李程研究员具有北京师范大学数学本科、美国UCLA大学统计学博士的背景。他在做博士课题时接触到生物芯片数据,开发了dChip、ComBat等被广泛引用的算法和软件,毕业后作为PI在哈佛大学公共卫生学院、Dana-Farber癌症研究所专注于生物信息学和癌症应用领域的教学和研究。从算法到软件再到与临床医生合作,他目前在北京大学生科院着力于三维基因组学实验技术、分析和应用于癌症的研究。

近日,在由中国研究型医院学会医疗和临床科研大数据专业委员会主办、HIT专家网承办的“医疗大数据应用与实践研讨会”上,李程研究员做了以《基于基因组学预测药效和联合用药靶点》为主题的演讲,从高校研究人员的角度分享了对基因组学大数据的研究经验,并探讨了如何将科研和临床需求相结合。

骨髓瘤患者基因组数据分析和临床结合,探索疾病发生的机制

李程团队的一个研究项目是针对多发性骨髓瘤。李程介绍,骨髓瘤患者的基因组是随着肿瘤的发生和发展而不断变化的,会出现很多单位点变异、染色体异位和拷贝数变化,而且会由于基因组的不稳定性随时间逐渐增加。通过生物芯片或测序技术得到整个基因组的拷贝数变化和表达谱后,能得到非常规整的二维数据表(行是基因或位点,列是样本)。通过统计算法对样本进行聚类和可视化后,可以提出多个生物学问题,例如:同样为骨髓瘤,为何两种亚型的基因组学变异非常不同,一个亚型有多条染色体的三体现象,而另一个亚型则富集染色体异位和点突变。

李程说:“十年前,大多基因组学的方法都通过基因表达谱去比较亚型之间基因的差异,然后再做通路富集分析。现在的新方法则不仅要看差异表达的基因,还要看差异表达的网络,即观察基因之间表达相关性的变化。”李程团队基于基因表达相关性网络的差异,开发了新的算法,以找出哪些转录因子和细胞周期停滞的通路的共表达在两个亚型中发生变化。

一个数据集分析出来的结果不一定可靠,可能会受实验材料或对象特异性质的影响。目前科研、药物研发行业中受到广泛关注的“可重复性研究”致力于提高研究结果的可重复性。李程认为,从统计学角度来看,每个数据集都可能包含实验中的随机因素,一个解决办法是使用多个不同实验室产生的相似数据集做宏分析(meta-analysis)。如果把多个数据集整合起来,通过宏分析后就能不仅找出某些特定的转录因子在两个亚型之间和细胞周期通路的相关性存在差异,而且这种差异在多个数据集中都有提体现,减少了数据分析中的假阳性结果。

如果止步于数据分析结果,生物信息和计算生物学研究者对生物学问题的贡献有很大局限性。基因组学数据分析可以提示基因和通路在某一个疾病中的功能,但是如何验证这些新的生物学假说、把它们转换成与疾病机制相关的新知识?为此,研究团队通过文献查阅,绘制了这些特定转录因子之间的相互作用、与细胞通路的关系图,提出了同时抑制ESR1和SP1这两个转录因子会对杀伤骨髓瘤细胞产生协同作用的假说。继而合作者实验室在细胞系实验中验证了这个假说。研究论文发表在了血液领域主流期刊《Leukemia》杂志上(https://www.ncbi.nlm.nih.gov/pubmed/23925045)。

通过基因组数据预测病人对药物的反应

很多年前研究人员就探索,能否根据病人的基因组学数据来预测病人预后的好坏以及对某种药物的反应情况?这也是精准医疗和靶向药物的雏形。如果能从基因组数据中发现新的肿瘤和预后标志物,将是制药公司和临床医生都非常感兴趣的。

“我们使用芯片或测序的方法得到肿瘤病人的基因组和表达谱变化信息,不仅能发现该肿瘤的亚型类型,而且可以根据变异特征的不同、基因组的差异、以及生存率和药效的差异,关联基因组和药效的数据来预测病人对药物的反应。”李程介绍说,“我们使用公共数据和合作者自己产生的多个数据集,每一组数据都包含病人的用药效果信息,使用机器学习算法,把样本数据分成训练、验证和测试数据集,做基因特征的选择和交叉验证,最后去测试模型。但是我们发现,只使用基因组表达谱数据和现有的样本量,不足以有效预测骨髓瘤的用药效果。科研课题可能最终得到的并不是我们所预期的结果,但是这一分析过程和最终结果对今后同行做类似的研究具有借鉴作用,所以学术期刊也选择发表了这个阴性结果。” (论文发表在《Leukemia》,https://www.ncbi.nlm.nih.gov/pubmed/24732597

 提倡交叉生命科学,多领域研究人员交叉合作

李程说,高校科研人员的主要任务是做科研课题、发表论文,在这个过程中培养研究生成为独立思考、能发现和解决科学前沿问题的研究人员。在做生物信息和计算生物学科研时,面对珍贵的临床样本产生的大数据,科研人员不仅要思考如何将这些数据转换成具有影响力的文章,而且要致力于把开发的新算法、发现的新生物学现象能够反馈、帮助到临床病人。

对于医院而言,医学研究者同样有发表论文的压力和需求。“但我们并不只是为了科研产出,为发表论文来做课题、写论文。”李程说,近几年正在高速发展的精准医疗、大数据对交叉生命医学研究起到了强有力的推动作用。针对这一机遇,他所在的北大-清华生命科学联合中心(http://www.cls.edu.cn/)提倡交叉生命科学,汇集生物技术、临床医学、大数据分析等各领域研究人员,鼓励研究组之间开展交叉合作研究,并且通过招收新体制博士研究生、轮转多个实验室后定导的模式培养新一代交叉科研人员。

医学大数据的类型很丰富多样,有组学、影像、信息管理等多层面。如果能对数据进行多维度挖掘,紧密与临床医生和研究者合作,结合关键临床医学问题,就有可能对病人的治疗和预后进行预测和帮助。李程表示:“只有当研究成果对病人有效和有用,科研人员发表的文章的影响力才会更高。要实现医学大数据的有效使用和研究,生物信息研究人员必须与医院临床和信息科同行合作,充分理解临床样本的收集、大数据的产生、医生的临床科学问题,从课题开始就一起设计和开展研究。”(鸣谢:本文在成稿过程中,李程研究员亲自做了详实的编辑修订工作)

【责任编辑:封诚】

 

赞(0)

评论 抢沙发

评论前必须登录!

 


未经允许不得转载:HIT专家网 » 北京大学生命科学学院李程研究员:基于基因组学预测药效和联合用药靶点
分享到: 更多 (0)