来源:HIT专家网 作者:姜浩 龚晨
京东健康进入真实世界研究(Real-World Study,RWS),助力临床科研?一开始接触到这一信息,有些将信将疑。然而,当与京东健康相关业务部门进行深度交流后,顿悟京东健康这一着可谓“水到渠成”。
从最初的医药电商业务起步,京东健康一直在大健康领域不断深入和扩展,目前已涉及医疗供应链服务、医疗健康服务、数字健康解决方案、智慧医疗解决方案等多个业务领域,同时与产业链上中下游各环节的企业、机构进行合作,以打造更加完整的大健康生态体系。
日前,京东健康技术产品部互联网医疗研发总监杜宝华在接受HIT专家网访谈时确认,在持续布局大健康产业生态的征程中,京东健康推出了RWD(Real-World Data,真实世界数据)平台。
从医药电商到互联网医疗、健康管理,再到为医学大数据科研领域提供技术和数据服务,京东健康这一步“跨界”的底层逻辑是什么?
瞄准RWS常见的两大数据痛点
“当前阶段,各医学研究机构正在进行的RWS科研,普遍存在效率与成本问题。”杜宝华认为,其中严重拖累科研效率与成本的两大关键痛点是:数据收集与数据处理。
根据《用于产生真实世界证据的真实世界数据指导原则(试行)》,真实世界数据(RWD)是指来源于日常所收集的各种与患者健康状况和/或诊疗及保健有关的数据,是真实世界证据(Real World Evidence,RWE)的重要基础。按功能类型分类,RWD的来源可分为医院信息系统数据、医保支付数据、疾病登记数据、来自移动设备的个体健康监测数据、其他特定功能数据(包括公共卫生监测数据、患者随访数据、患者用药数据等)等。
没有高质量的、适用的RWD支持,高质量的RWS也就无从谈起。然而,在临床科研实践中,由于各种RWD来源之间相对独立和封闭、数据存储分散且标准未能统一、数据整合和互联互通存在困难,造成数据碎片化和孤岛现象突出,使得RWS的数据收集之路障碍丛生。
比如,在医院信息系统数据等“院内数据”的收集过程中,临床科研人员普遍需要花费大量时间、精力,用于各业务系统的数据提取、清洗、转化等基础性治理工作中。
更为棘手的问题是“院外数据”的收集。以病例随访数据为例,这是RWS的重要一环,包括院内数据无法涵盖的一些重要临床指标,如总生存期、五年生存率、不良反应信息等,需要长期追踪。在大部分医疗机构,随访工作普遍存在失访率高,随访内容不完整、不准确,随访的时间与人力成本高等问题。这些真实性、准确性欠佳,乃至大范围缺失的随访数据,将在很大程度上影响RWS的研究价值。
而在数据处理阶段,临床科研人员的痛点在于“寻求工具”。为满足不同类型的数据处理需求,他们往往需要不断寻找、学习各种各样的数据分析技术与软件应用;而且这些工具之间是缺乏联系的,因此还需要临床科研人员的“自行集成”,才能借助多款工具完成一项数据处理任务。数据处理阶段的耗时之长、效率之低,很大一部分原因在于数据分析工具“不够好用”,临床科研人员迫切需要一款多功能、一体化的工具,以提升整体效率。
发挥京东健康恰好具备的大数据资源和技术能力
“在健康大数据与AI应用方面,京东健康有着丰富的资源积累和相关经验能力,而这些能力与经验刚好可以与RWS数据收集与处理的难点问题相匹配。”杜宝华介绍,京东健康可以将这些能力“平滑适配”到RWD平台上,为临床科研人员提供一款“好用”的科研工具,协助其处理数据收集与处理中大量耗时费力的基础性工作,将精力投入到更需要他们投入智慧的工作内容中去。
在数据融合方面,在京东健康互联网医院、京东家医等产品线的合力支持,以及多个智慧医院、健康城市项目的建设基础上,京东健康RWD平台目前已拥有完善的院外数据服务能力,可以形成一条较为完整的全周期、多维度的患者健康数据服务链路。
其中,京东健康自带的C端连接能力,可以帮助RWD平台破除“患者随访数据缺失”的老大难问题。RWD平台可以与京东健康互联网医院的成熟诊疗工具与线上随访能力进行有效结合,实现患者智能圈定与分组,基于自定义分类标签的能力,提取相关标签值域,分析人群特征分布,一键智能分组,帮助科研人员快速建立理想的人群分组;依赖京东健康互联网医院在线问诊资质,可实现便捷的医患在线会话;基于智能语义逻辑设定、话术模板导入、人群圈定及动态更新等技术手段,可实现智能电话随访,支持面向大群体的简单随访工作智能投放,极大地减少重复性工作,帮助临床科研人员提升随访效率。
在与中国心血管健康联盟的合作中,京东健康RWD平台通过沉淀患者的诊疗、康复与日常行为等真实世界数据,并结合血糖仪、血压仪、运动手环等智能设备所共享的数据,形成了患者院外多维度健康数据集。另外,通过RWD平台的智能随访能力,医生能够全程跟踪、全面了解患者的疾病进展,为患者提供更精准的治疗方案,同时助力医生高效积累临床研究数据,其数据收集效率达到传统模式的6-7倍。
在数据治理方面,京东健康RWD平台支持两层数据集的架构模式:底层通用字段集提供标准化字典规范,能够统一、规范处理信息;基于通用字段集构建的专病字段集能够满足多方科研诉求,支持医疗机构自定义专病模型。
为解决多源数据的整合问题,京东健康RWD平台提供开放的、可扩展的数据映射组件与清洗组件。基于京东健康知识图谱平台,RWD平台可以通过自然语言处理技术进行语义识别、聚类与分类等,对在院内外采集到的非结构化医疗数据进行数据结构化与标准化处理。同时,以通用字段集为映射标准,RWD平台可以通过数据质控组件进行数据填充,清理无效值域,保障数据质量。
在数据分析方面,京东健康RWD平台支持灵活的科研表单配置,以自研的医学量表系统为基础,通过对题型规则的灵活组合,可支持20多种题型,满足基本的科研调研需求。RWD平台可以通过Flink实时计算引擎对数据进行预处理,利用ClickHouse列式存储能力进行海量数据检索与分析。基于这套数据分析引擎,RWD平台可多维度分析调研内容的相关性,具有千万级规模数据的实时分析能力、亿级规模数据的准实时分析能力,可以提供多维图表形式,并支持分析结果导出,能够帮助临床科研人员更全面地了解数据情况。
在数据隐私与安全方面,RWD平台能提供完善的数据安全体系,对照金融行业的数据安全等级,通过建设医疗行业的数据安全管控体系,让临床科研人员在获取“好用”服务的同时,更能感到“安心”。在数据存储与传输方面,RWD平台采用数据加密措施,并有严格的秘钥管理机制,保障数据安全;在用户隐私保护方面,RWD平台将全部数据进行脱敏处理,并具有隐私计算能力,保障隐私信息安全;在信息追踪方面,RWD平台通过应用全路径埋点安全日志,并依托京东安全风控系统感知异常的操作行为,来规避数据泄露、窃取问题;而在数据权限管理方面,京东健康有严格的权限管控体系,RWD平台可以分角色从应用与数据多维度保障数据使用安全。此外,在登录鉴权、安全防范、漏洞检测等方面,RWD平台也有京东强大的安全运维团队支持,通过多重成熟的技术手段保障系统安全。
除此之外,京东健康RWD平台可实现多视角项目跟踪管理与风控能力,基于项目维度、患者维度等进行科研项目的跟踪管理,提供智能检测能力,及时感知滞留表单、无效表单,让临床科研的管理流程更“顺畅”。
RWD平台肩负“双重使命”
杜宝华认为,RWD平台是京东健康一款肩负“双重使命”的新产品:
对外,京东健康RWD平台面向医疗机构、医疗学科学会、医疗集团与药企等用户,旨在为其RWS科研工作赋能,帮助医疗机构降低科研投入、辅助优化治疗方案、推动科研队列快速落地;帮助医生降低科研项目的准入门槛、快速取得成果进展;帮助药企快速创建药品RWD临床研究、加速产品上市等。
“未来,京东健康将通过生态化的方式建设RWD平台,一方面与业内垂类RWD平台携手共建RWD生态,另一方面,通过提供SaaS服务,满足多方诉求,对接多种角色,最大程度地满足不同用户的使用需求。”杜宝华说。
据介绍,RWD平台底层将以租户化方式提供服务,保障租户的数据隔离;同时通过PaaS化的方式,对各方的差异诉求进行扩展、定制。在实际应用过程中,平台上会存在多种个性化科研队列,无法通过标准化的方式满足全部队列的需求。此时,平台可通过PaaS化的能力提供一些扩展点,用以解决个性化队列的定制化问题,规避不同研究者或研究机构之间的影响。通过这种在线平台化方式,临床科研人员可以实现秒级开通服务。
为支持更多机构的“拎包入住”,京东健康正计划打造一个标准化、规范化的数据采集平台,并对外进行技术开放。对于新接入的机构而言,借由这个平台,可极大程度地减少入驻RWD平台的前期IT准备工作。
另一方面,京东健康RWD平台的对内任务是帮助京东健康实现企业内部的数据沉淀、整合、资产化,促进京东健康在技术驱动创新领域迈上新的台阶。杜宝华坦言,早前各业务平台之间存在信息孤岛,如今京东健康正在通过RWD平台推动不同业务形态下的数据融合,致力于将分散、无序的健康数据,转化成多维度、有秩序、高质量、高价值的数据,对真实世界的健康业务形态进行有机结合,并由此实现数据驱动下的各类业务创新。
无论对RWS领域还是京东健康自身而言,肩负“双重使命”的京东健康RWD平台都将是一股新生力量,或将由此撬动数字健康产业生态的进一步重构。
【责任编辑:秦勉】
评论前必须登录!
注册