专业咨询
致力推进中国医疗卫生信息化

数据成为医院核心资产,基于数据湖的全院级数据中心来了

来源:HIT专家网       作者:陈曦

在云计算、物联网、5G、AI等新技术的应用浪潮中,全新的数字医疗生态正在构建,由此产生的大量数据不仅是推动医疗科技向未来发展的核心基石,也使得医疗已然成为数据密集型产业。目前,对于单个医院而言,医疗过程产生的数据量正在从TB级向PB级跃进。数据开始成为医院最为核心的资产之一。

“谁掌握了医疗数据,谁就掌握了医疗的未来。”在3月28日举办的“新一代医院信息系统建设研讨会”上,戴尔科技集团数据中心事业部业务拓展经理詹爱军指出,让数据“崛起”与“闪光”,是在构建面向未来的新一代医院信息系统时需解决的当务之急,并介绍了戴尔智慧医院数据中心如何帮助医院把数据“用活用好”。

将全院数据汇至“数据湖”

要发挥数据的真正价值,使其成为医院日常运营所依赖的核心,并为未来提供源源不断的发展动力,需要打造开放、稳健的信息系统基础架构,从而既能支持现在,并能面向未来。

戴尔科技智慧医院总体架构

戴尔科技智慧医院总体架构的核心设计思路之一,是数据的整体管理与高效利用。其中,数据汇聚层完成对全院级医疗数据的汇聚,从而打破“数据孤岛”,这一层需要引入数据管理的整体解决方案,实现对数据的全生命周期管理,提升数据可用性,确保向下一代信息系统迁移时有统一的数据来源;数据集市层的任务是完成数据分类,根据临床、管理、教学、科研等不同的数据用途,形成多个数据中心;智慧应用层则负责完成对数据的有效利用,为智慧就诊、智慧院区、智慧管理等具体应用提供数据支持。

在数据汇聚层,戴尔科技帮助医院打造基于数据湖的全院级数据中心。近年来,“数据湖”的概念正日益深入人心。与整体预处理方式相比,“数据湖”能够保留数据的原始性特征,只在进行特定问题研究时才进行数据预处理,从而避免信息损失。基于数据湖的全院级数据中心,可以对接来源于各个应用系统的结构化、半结构化、非结构化数据与流数据,支持对HDFS、SMB、NFS、HTTP、S3等多种数据进行清洗、整合、计算与展现,避免了医院在搭建多个数据应用平台时对数据库建设的重复性支出,同时极大地提升了数据处理的效率与质量。

戴尔科技新一代医院数据中心架构

在戴尔科技智慧医院数据中心的整体架构中,除基于数据湖的全院级数据中心外,还包括基于分布式架构和VMware的云平台,以及数据安全保护平台。其中,业务系统被放置在基于分布式架构和VMware的云平台上,该平台支持虚拟机、容器、K8s等多种应用部署以及公有云、私有云、IoT边缘云等模式;数据安全保护平台则为数据中心提供同时实现物理、虚拟和云原生、容器、开源数据库等新型应用的企业级数据保护解决方案,从而确保医疗数据的备份、恢复、归档、迁移与容灾安全。

出众性能 出众表现

詹爱军以基因测序为例,说明戴尔科技的新一代医院数据中心是如何支持医院新兴应用的发展的。“将几个人的全基因组测序数据从基因测序仪拷贝到分析平台上,采用传统方式往往需要花费1-2天的时间。而在戴尔科技新一代医院数据中心,基于数据湖,直接对接基因测序仪、数据分析和实时计算平台,可以实现对基因数据的实时访问与就地分析,从而极大地提升了基因数据分析效率。”

新一代医院数据中心之所以能拥有出众表现,还源于其以下几大性能特点。

应用与数据分离。医院的业务系统被安排在基于分布式架构和VMware的云平台,而数据则在数据中心进行统一运维与保护。这种分离式架构,确保数据中心在未来可以拥有极大的弹性与灵活性,并发处理能力和存储空间得到了很大的改善,不但可以满足海量数据的全生命周期管理需求,云化的管理方式也有效降低了医院的运维成本。

支持多类数据管理。数据湖对接来自全院应用系统的结构化、半结构化、非结构化数据与流数据。对不同类型的数据进行管理,不仅需要极具前瞻性的设计,更需要统一、开放的平台支持。新一代医院数据中心可根据数据访问度自动调整存储位置,对数据进行智能化管理,让“热数据”拥有最佳的访问性能、“冷数据”拥有最佳的存储空间,而且数据始终拥有一致的控制权限,从而实现“一份数据、多人使用”。

以应用为中心进行管理。医院业务系统的应用部署和资源管理方式各异,多个集群的运维管理工具和方法也有所不同,因此,应用治理的策略无法同步到所有集群中。为支持容器和虚拟机共存的应用,有的医院选择建立Docker平台,无形中形成了新的数据孤岛。对此,戴尔科技引入了VMware的全新产品vSphere 7。vSphere 7在控制平面中嵌入了K8s,不再需要配置单个虚拟机或容器,而是以应用为中心,控制整个应用的资源分配,从而帮助医院进行更好的整体化管理,也为未来向云平台的平滑过渡奠定基础。

支持系统弹性扩容升级。随着业务系统数据量的增长,传统的存储扩容方式往往会为医院信息系统新增物理上的存储孤岛,造成运维和管理上的困扰,从而成为医院信息化建设的瓶颈所在。戴尔科技新一代医院数据中心支持横向的分布式扩展,医院可从3-5个信息节点开始起步建设;此后,在不中断生产的前提下,可根据业务发展所需,敏捷扩展至几百个乃至更多的信息节点。

全面持续的数据保护。从连续可用、CDP、备份、长期数据保存到归档,戴尔科技为新一代医院数据中心提供全面持续的数据保护,帮助医疗机构的数字化转型加速创新步伐,免除后顾之忧。

数据驱动医院发展

目前,戴尔科技已为全球超过8000家医院提供医疗行业基础架构解决方案,同时利用其全球经验帮助国内超过3000家医院进行数字化转型。会上,詹爱军介绍了戴尔科技帮助某医院搭建新一代数据中心的实战经验与体会。

该医院兼顾临床、教学与科研多类需求,业务系统众多,特别是PACS数据、电子病历、病案翻拍等数据高速增长,同时科研和教学产生了大量的非结构化数据处理和文件共享需求。为解决PB级别数据的存储、管理、科研、共享等需求,该医院基于ISILON构建数据湖平台,将全院包括PACS、B超、心电、病理、文件等所有非结构化数据全部存储在ISILON上。数据湖平台建成后,具有管理简单、使用简单、扩容简单的特点,数据通过NFS/SMB协议存储到数据湖平台中,可以通过FTP、REST API、HDFS等多种协议访问,供医疗、教学和科研等多个不同的应用使用。

戴尔科技为该医院搭建的基于数据湖的全院级数据中心,一期项目总容量为1PB,后期可轻松扩展至数十PB,充分满足电子病历、HIS、PACS、超声、病理、基因测序、科研等多个业务系统的存储需求。

为支撑各类应用的稳定运行,该医院原有600台虚拟机,预计未来这一数量将增加到1000台以上。目前的600台虚拟机原本需要5-6台存储终端进行支撑,采用戴尔第五代高端存储产品后,2台终端即可满足需要,存储空间由原来的200TB降低至50TB,有效存储容量的节约率高达75%。这不但帮助该医院节省了大量使用成本和存储空间,更有助于信息系统稳定性与安全性的提升。在数据保护方面,该医院采用双活数据中心,实现零宕机、零丢失与零业务感知,同时确保数据记录的逻辑性,防止因数据逻辑错误而出现的问题。

拥抱数据,从而拥抱未来。詹爱军表示,在医疗数字化转型的道路上,戴尔科技愿为医疗机构提供管理与利用数据的高效工具与解决方案,鼎力支持医院盘活医疗数据这一最重要的核心资产。

关注HIT专家网微信订阅号
精彩不容错过!

【责任编辑:陈曦】

赞(8)

评论 抢沙发

评论前必须登录!

 


未经允许不得转载:HIT专家网 » 数据成为医院核心资产,基于数据湖的全院级数据中心来了
分享到: 更多 (0)