专业咨询
致力推进中国医疗卫生信息化

【吴坤专栏】全方位解读医疗信息集成平台系列特别篇:容灾应对之道

来源:HIT专家网 作者:吴坤

【编者按】

当前,大中型医院大多正在建设医疗信息集成平台,以实现医院内部众多软件系统之间的联动,促进全业务流程的信息化、智能化。对于医院信息工程师而言,理解和掌握集成平台相关知识技能非常重要,甚至将会成为其核心技能之一。

华中科技大学同济医学院附属同济医院信息中心软件工程师吴坤,计划在专栏中通过系列文章,介绍医院信息集成平台的基础理论、核心技术、设计方案、典型案例等,与业界同仁讨论“集成平台与数据中台,医疗机构如何选择?”、“集成平台推动下的医疗数据体系建设”等问题。

在医疗机构内部,除了主业务(HIS)系统外,对稳定性要求最高的可能就是医疗信息集成平台了。一旦集成平台出现任何故障,各业务系统之间将无法联动工作,进而导致整个医疗业务无法展开。特别是对于大型医疗机构而言,将是致命打击。

本文对医疗信息集成平台的容灾方案进行探讨,以期能起抛砖引玉之效。

集成平台的备灾方案,主要有如下选择:冷备、热备、双(多)活和集群。

冷备方案

冷备方案的主要思路是将集成平台的配置数据、元数据,以及通信接收的医疗业务消息数据存储与集成平台应用独立出来,存储在RAID阵列服务器,并通过存储局域网(SAN)与主备应用服务器相连。在集成平台的主应用服务器发生故障时,其业务数据文件(包括配置文件、消息数据等)不受影响。通过快速启动备用服务器,即能恢复工作。

冷备方案在技术上的实现相对简单,如图1所示。

图1 冷备方案架构图

但在实际应用时,冷备方案存在一些问题。例如主应用服务器出现故障时,无法实现备用应用服务器的自动切换,需手动执行切换过程,这可能会导致医疗业务中断一定时间;另外还会出现数据平台单点故障问题。

热备方案

在热备方案中,同时部署生产和灾备两套集成平台系统,包括应用软件和数据交换平台,如图2所示。

图2 热备方案架构图

热备方案将数据交换平台同时部署到生产运行服务器和热备份服务器,主/备服务器同时处于运行状态,在主服务器出现故障时,将业务自动切换到备用服务器。

热备方案解决了集成平台出现故障时需手动切换的问题,主机出现故障时可自动切换到备用服务器处理业务。用户常常感知不到主备机的切换过程,保证了系统的持续运行,同时也能够适应对实时性要求比较高的业务。

但是,热备方案仍然不能完善解决单点故障的隐患。同时,由于热备服务器只接收来自主机的底层数据同步,不能作为独立的业务处理服务器,仅仅为管理员提供了修复主服务器的时间窗口,热备方案仅有一台服务器保持运行,因此服务器总体资源利用率仍然不足50%,而且数据同步消耗资源,降低平台性能。 

双(多)活方案

在双(多)活方案中部署的各台服务器没有主备之分,均是独立部署,能同时运行并处理业务,提高了资源的整体利用率,解决了热备方案中备机常年处于闲置状态的问题,在保证高可用的同时,也解决了单台服务器处理的性能瓶颈问题。

但是,双(多)活方案中仍然存在着管理监控不统一以及同步性问题。任何一台引擎上的配置修改,都需要手动同步到其他引擎服务器上。同时,该方案也不适用于对消息处理顺序有要求的项目,因为消息被平均分发到多台服务器后,消息原本的处理顺序无法得到保证。

对于医疗机构,特别是大型三甲医院的应用场景而言,上述几类灾备方案都存在一定的问题,不能充分满足大型医疗机构的业务需求。

集群方案

集群方案分离了管理监控、生产服务、数据存储等功能,通过负载均衡构建集群体系,实现一处配置、多点运行、数据一致的功效,如图3所示。在集群方案中,多台服务器同时处理业务。即使某个服务器出现故障,也能由其他服务器无缝接管业务,避免了服务器故障时的业务中断,保证业务的持续运行。 

图3 集群方案架构图

集群方案不仅解决了单点故障和硬件资源利用率低的问题,同时提高了性能。在冷备或热备方案中,只有当主机出现故障时,备用服务器才开始运行并接管主机业务,硬件资源利用率不到50%。相比之下,集群方案能通过集群架构来提升系统整体的处理能力,同时负载均衡机制能提供高效合理的任务分配方案,大幅提升了系统的总体运行效率,硬件资源利用率可达到70%-80%,在绝大多数医疗数据应用场景中,能够提供很高的性能效果。

当前,要实现集群方案的高可用,主要有两种方式:一种集群方案是实现硬件和操作系统级别服务的故障转移,从而达到高可用。但是,这一方案很难实现业务服务的故障转移。例如,引擎仍在运行,但引擎中处理的某些业务流程出现故障时,这种集群方案就难以做到故障转移了。另一种集群方案则是针对医疗集成平台的业务特点,开发应用级软件集群,将服务部署到多台服务器上同时运行,可以实现动态扩展和故障转移,同时更达到高性能和高可用的效果。 

集群方案比较适合三级医院、医院集团等业务量大,对于高可用性和实时性都有较强需求的医疗机构,能够保证集成平台的高性能及日常运行的长久稳定。

此外,随着云计算、5G、物联网等新技术、新环境的出现,更高速率、更低延时和更多设备的网络接入,意味着数据处理量的巨幅增长。在最新出台的2020年医院信息互联互通标准化成熟度测评方案中,对CDR的数据传输时效性也提出了更详细的要求。传统集群方案虽然能满足医疗业务当下需求,但在应对未来医疗信息技术和环境的快速发展和转型升级时已略显乏力。

针对这个问题,大家可以关注一下云原生集群方案,其是基于最新容器编排技术Kubernetes (K8s)的PaaS层云原生分布式集群架构,通过容器化技术来提供高可用、高并发、高性能、低延迟的云平台,充分支持物联网、5G环境下大规模数据互联互通的需求,助力医院适应新技术下IT环境的转型升级,满足未来大型医疗机构数据集成和业务流程协同等需求。

然而,由于该方案采用了容器化等最新技术,也对医院信息部门运维人员的技术能力和厂商的技术支持力度提出了更高的要求。就当前整个医疗信息行业的人才现状而言,普及应用还难以实现。但是这一方案应该是我们整个行业所追求的方向。

结语

从冷备、热备、双活到传统集群、云原生集群,集成平台的容灾方案紧随环境技术以及医疗机构需求的改变而不断优化。但在集成平台建设过程中,医院仍需结合实际情况,选择最适合自身需求的容灾方案,以在医院内发挥出集成平台的最大价值。

【作者简介】

吴坤,计算机专业硕士,华中科技大学同济医学院附属同济医院信息中心软件工程师。专业计算机程序员,医疗信息技术推广者,积极参与社会活动,热衷于以信息技术提高医疗行业服务质量和改善患者就医体验。

关注HIT专家网微信订阅号
精彩不容错过!

【责任编辑:闻雨】

赞(7)

评论 抢沙发

评论前必须登录!

 


未经允许不得转载:HIT专家网 » 【吴坤专栏】全方位解读医疗信息集成平台系列特别篇:容灾应对之道
分享到: 更多 (0)