专业咨询
致力推进中国医疗卫生信息化

星环科技:湖仓一体化,让医疗行业多模态数据融合成为现实

来源:HIT专家网      作者:孙婧 整理

当前医院数据治理存在诸多瓶颈,如数据冗余问题严重、多模态数据融合难等。如何打通不同业务场景下的数据、特别是异构数据,让数据真正流通起来?是医院数字化转型的重要课题。

2023年7月15日,在“2023年互联网医疗建设与运营研讨会”上,星环信息科技(上海)股份有限公司(以下简称:星环科技)行业资深售前架构师徐杰分享了通过湖仓一体化,消除数据湖、数据仓库的壁垒,进而实现数据融通的技术路线。

星环信息科技(上海)股份有限公司行业资深售前架构师徐杰

大数据不在“大”,在于通过专业存储和处理提高数据质量

大数据的本质不在于数据规模的宏大,而在于如何进行专业数据存储和处理,从而挖掘数据的要素价值。徐杰介绍,作为我国领先的大数据基础服务提供商,星环科技一直致力于国产化数据库的自主研发,通过大数据、云计算和智能化,提供数据从集成采集、存储、加工、分析全链路的解决方案。

徐杰首先分析了当前医院数据治理面临的困境,主要如下:

一是数据重复加工和数据冗余问题严重。医疗领域因业务复杂性和多样性,信息系统种类繁杂。系统间数据处理职责划分不合理、口径不一致,数据重复加工和数据冗余问题较为严重。

二是异构数据造成语义鸿沟,多模态数据融合难。不同模态数据的描述不一致。医疗数据由不同的设备生成,各设备生成的数据格式、编码方式、数据粒度大小等也存在很大不同,跨越语义鸿沟任重道远。

三是实时数据处理、高并发数据处理难。传统数据仓库主要面向数据分析型应用,较难处理非结构化数据,难以快速实现数据探索、数据挖掘与业务建模需求。

解决以上数据治理难题,需要大数据基础架构的技术革新。当前普遍采用湖仓并行架构,“甚至不止一个湖一个仓”,这一数据平台解决方案带来的问题是系统复杂性高、实时性较低。“采用云原生多模数据库技术,构建湖仓一体化大数据平台,是未来的技术发展方向。”徐杰说。

湖仓一体化的“四个统一”,让数据实现真正融通

所谓湖仓一体,即打破传统Hadoop+MPP的混合部署模式,实现湖仓技术架构上的统一。具体而言,星环科技以自主研发的分布式分析型闪存数据库ArgoDB为依托,实现了“四个统一”:

一是统一集成。梳理现有数据接口规范文档,制定统一数据接入规范体系。建立统一数据集成平台,兼容现有采集接口,打破传统独立管道采集模式,实现数据统一采集管理。

二是统一存储。当前医疗领域非结构化、半结构化数据不断增多。星环科技研发了统一的分布式数据管理系统TDDMS,为不同存储引擎提供公共的存储管理服务。具体实施为:对结构化数据进行数据标准化后存入归档池;对非结构化数据构建索引,并在归档池存储索引数据。目前已支持关系型、搜索、文本、对象、图等10种数据模型的存储。

这种新型开放式数据平台架构,具备统一的存储管理和统一的对外接口,兼具数据仓库的结构和治理优点,以及数据湖的扩展性,有效降低运维管理成本,也避免了数据孤岛。

三是统一管控。一些医院信息系统缺乏统一规划和数据标准管理,导致上层数据应用存在诸多问题。星环科技湖仓一体平台提供全生命周期的数据管控能力,实现多模态数据以及元数据的统一管控,同时支持统一的多租户管理,确保租户从资源层、数据层、应用层等都能实现完整隔离,解决数据“血缘”不清、管理复杂等问题。

四是统一应用。数据操作层提供SQL语法支持,可实现统一接口处理不同的业务和不同数据模型,解决因场景切换、数据库切换而造成的接口、开发语言切换等问题,避免HIS、EMR等核心业务系统在数据共享时“不堪重负”。

湖仓一体化不仅支持批处理、流处理等不同类型计算任务,还支持跨模态数据的融合分析,这无疑为智慧医院建设提供了技术支撑。

湖仓一体化大数据平台的三大应用场景

目前,星环科技相关解决方案落地案例覆盖了金融、政务、医疗、交通、能源等行业,在医疗领域主要有三大应用场景。

一是医院湖仓一体数据平台解决方案。无需改造医院现有各类信息系统,将医院数据中心与医疗应用分层解耦,基于多模型大数据平台统筹建设医院数据中心。面向临床、管理、科研按需提供统一数据服务,避免造成不必要的数据重复采集和接口对接。

星环科技“医院湖仓一体数据平台解决方案”

临床数据中心(CDR)方面,生产系统数据实时同步到CDR,并基于患者主索引实现多系统数据关联融合,实现多维灵活自助分析和BI分析的秒级响应。

运营数据中心(ODR)方面,支持海量多源数据关联融合,满足医院业财一体化融合数据分析需求。

科研数据中心(RDR)方面,支持面向科研专病多模态数据的统一存储和高效检索,提供可视化自助分析探索工具;同时具有AI分析、图谱构建分析等智能工具以及分布式图数据库系统,可满足海量医疗知识图谱构建的性能要求。

二是区域医疗中台解决方案。建设“2中心、2体系、4中台”的医疗云中台架构。其中的“2中心”,即存储各层机构汇集数据的“医疗卫生数据资源中心”和将数据、模型、业务三类资源以目录形式发布的“统一资源服务中心”。

“2体系”,即“数据标准与规范体系”和“安全运维与保障体系”。

“4中台”,即提供底层计算和存储技术组件的技术中台,对数据进行集成、开发、调度、治理、建模的数据中台,根据需求开发模型和算法的AI中台,以及根据需求对应用系统进行开发、测试和部署的业务中台。

三是医院信创数据平台解决方案。星环科技与软件开发商、硬件开发商、系统集成商等合作,打造大数据基础软件应用的生态体系。已与国内主流软硬件信创厂商完成兼容适配,与飞腾、鲲鹏等硬件及麒麟、UOS(统信)等国产操作系统深度适配。

“天下大势,合久必分、分久必合。”徐杰介绍,当前大数据分析技术,已从最初“Hadoop解决海量数据分析”,到“大数据技术栈百花齐放”,再到现在迎来“基于云基础设施的技术栈统一”时代。实时化、统一化、云原生化的湖仓一体架构,将推进医疗领域数据治理能力的持续进化,充分释放数据价值。

此图片的alt属性为空;文件名为HIT%E4%B8%93%E5%AE%B6%E7%BD%91%E8%AE%A2%E9%98%85%E5%8F%B7.png
关注HIT专家网微信订阅号
精彩不容错过!
此图片的alt属性为空;文件名为9fd96946f80198b.png
寻求“商务合作”请扫码填写需求
我们将尽快与您联系!

【责任编辑:陈曦】

赞(4)

评论 抢沙发

评论前必须登录!

 


未经允许不得转载:HIT专家网 » 星环科技:湖仓一体化,让医疗行业多模态数据融合成为现实
分享到: 更多 (0)