专业咨询
致力推进中国医疗卫生信息化

医院信息系统业务连续性讨论:双机热备、RAC还是x86一体机?

来源:HIT专家网            整理:小虫

英特尔云计算创新中心

编者按:

五一劳动节,本是休息的日子。HIT专家网微信群的医院信息科主任们却围绕一个HIS双机热备及服务器宕机后的切换问题,展开了深入的讨论,其实质是如何确保医院信息系统的业务连续性。多位主任给出了他们的实战体会,从中也可看出医院基础架构选型的走向变化端倪。

赵京湘 16:04

请教:哪个医院的HIS系统做到了双机热备?是否能实现毫秒级的切换?如果HIS的服务器(SUN小机)发生故障,最短的切换时间是多少?还有,有必要两套存储吗?两个服务器设置时间相差两个小时。

信笔 16:09 

现在三级医院上系统时间比较长的,基本都是双机备份了吧。

赵京湘 16:10

切换花了一个小时。

信笔 16:10

这个时间比较差了。

湘里乡亲 16:15

而且因为两台服务器时间差两个小时,导致切换后数据对不上,说是切换就会有延迟,所以时间设的不一样。请问,这有道理吗?

吴杰 16:53

我们做应用服务器集群,数据库active-standby,两库用同一套数据文件,数据库坏了可以即时切换(自动漂移)。

赵京湘 16:55

那存储是一套还是两套?

吴杰 16:56

再配上数据库实时发布到另一台备份服务器,如果是存储坏了可以用1-2小时手工恢复文件。这时启动单机版收费。备份服务器兼作病人查询服务器。

湘里乡亲 16:56

不是数据库坏了,是小机主板坏了。

吴杰 16:56

存储是一套。对,主板坏了仍是数据库服务器不工作吧。上次还听工程师说老鼠把线路咬断了。

信笔 16:59

@吴杰 这个有可能,特别是水平布线不规范或临时布线时可能被老鼠咬,以前发生过。

吴杰 17:00

得在线路上撒老鼠药,这是安全防护的一部分[呲牙]

信笔 17:02

@吴杰 一般如果用规范的线管或线槽,遭老鼠的可能几乎没有。

饮水栖衡 17:02

还有的说法是系统中毒了,反正里外里都是说外因。

湘里乡亲 17:02

目前的技术,我们能承诺的业务中断时间可以在一年一小时之内吗?

吴杰 17:03

@湘里湘亲 可以吧,只要硬件够。

信笔 17:04

@湘里乡亲 7×24小时,每年停机小于1小时是允许的

饮水栖衡 17:05

甲方乙方利益不同,有合作也有对立,所以首先自己要明白,才能防止被乙方忽悠。@信笔

湘里乡亲 17:05

硬件都是新买的,相当够。

饮水栖衡 17:07

硬件其实没那么可靠,如果赶上寸劲儿,可能会出现多次问题。2002年做过his双机热备,硬件软件都出过问题,但还是以硬件的为多。实际上看,双机热备可靠度不一定比非热备高。

湘里乡亲 17:12

硬件能干的事很多,可以做双机,冗余,灾备…反正我们能买的都买了。

饮水栖衡 17:14

安全系统配置过于繁琐,反而容易出安全事故。

湘里乡亲 17:14

倒是现在我觉得整个集成的方案,安全策略的制定,成了应该关注的向题了

饮水栖衡 17:14

没错。设备是基础,策略才是最重要的。很多时候,都是出了事故才明白的。出事故没啥可怕的。数年前,我们Pacs双机热备出现过因为网络原因频繁切换,最终酿成数据故障。后来干脆不自动双机了,这样反而可控……都是教训。

邝志光 17:23

我们做了,用美国容错服务器,很好。

朱若华 19:25

容错服务器在故障切换上比双机热备要稳定的多,最大的问题就是投入偏高,后期出现故障的维护升级费用高。

汪鹏重庆西南 17:29

用RAC的应该都能做到。我院用了7年多的HP小机dataguard热备,需要手动切换,但一直都很稳定,简单高效。

饮水栖衡 17:32

@朱小兵 半自动的好!实用!

朱小兵 17:32

与您刚才的心得一致。

goal 17:38

双机热备是非常浪费资源的,我们05年的时候就是这样,只有一台机能用,另外一台永远的在备着,后来08年改为直接用Oracle的RAC方式,两台小机都用起来了,然后再用dataguard在另外一台机做日志同步。Rac,我们也是现在客户端用不同配置来实现相对的均衡。

EMC杨捷:17:40

如果是Oracle数据库,可以用RAC实现两台主机并行,就能实现您要的这种效果。

goal 17:44

其实这个就是高可用的问题,但由于现在的系统有中间层,所以,我们还利用vm的可迁移的特性把中间层服务部署在虚拟机和物理机上,保证中间层高可用。

CHIMA_HIT 17:48

Oracle RAC是个不错的方案。缺点是扩展性不好,节点间通信开销大。另外一个就是写入量大時,节点无法动态加入集群。

goal 17:54

最多三个。

王胜靖江 18:07

PC双机~小机RAC~小机双机。

姜疆 18:08

数据后端切换用存储虚拟化实时镜像自动切换,切换时间小于2秒;在保证后端数据高可用情况下RAC前端切换估计不超过一分钟。

CHIMA_HIT 18:11

虽然双机1+1>2,但是网络的开销大。

RAC缺点:集群内通信很容易成为系统瓶颈,尤其节点多的时候。要仔细的设计应用减少内部通信的需求。我们做过的测试中两节点5小时10分能做完的数据汇总关闭一个节点5小时半做完了。

王胜靖江 18:12

1+1<2,网络开销不是主要的。关键刚开始很好,时间长了部份硬件更新,两台机的环境不同了。建议不要用RAC,除非保持两台机的绝对一致,一台机的cell板坏了,另一台最好一起换。

朱小兵 18:18

看来有两派意见。

王胜靖江 18:21

环境不同后,数据同步有障碍,双机就会出现互相排斥的现象

goal 18:24

我们两台小机基本一致。

黄慧勇 18:25

个人认为华侨医院吴庆斌的方案最实用!我们医院也是如此做法。半自动的方式更可控!

goal 18:27

@湘里乡亲 主任要把他们的服务器及存储配置和应用系统架构详细说一下,可能会找到个适合他的方案。还要考虑投入问题。

黄慧勇 18:33

我看过所谓N+N的无缝接管方案,但接管后数据不一致会很大祸的。所以不能光听厂家忽悠,还是要看自己的短板在哪里,组合拳最有效。硬件故障易解决,逻辑故障难解决,人为故障最可怕!

王胜靖江 18:35

刚开始是一致的,有配件坏了后,换的配件即使一样管现软件版本也不同的。亲身体验,有数据同步不了的隐患,在最忙的时候,经常出现半分钟到一分钟的停顿。

黄慧勇 18:43

我院自九八年起用IBM小型机以来,硬件故障导致的不可用很少,逻辑故障导致的多,或为误操作。应用软件SQL写得臭导致死机什么双机方案都没救。

goal 18:57

我们也是IBM[呲牙]

CHIMA_HIT 18:58

@吴庆斌 其实IBM的小型机以上的产品是过硬的。

goal 19:02

我们现在有两台用了九年的570还在做容灾机;PC Server 都变成联想了。上个月有台3850主板坏了,好在还在保内。

居益君扬州 19:05

我们现在也是IBM的。

泡茶为生(欧阳杰) 19:06

现在不是提倡云架构吗?厂家都不推荐小型机了。

居益君扬州 19:07

现在正在论证更新是换小机,还是换x86 一体机。请教各位高见[抱拳]

鸿毛 19:08

我也是IBM,稳!

皇甫宜娣 19:09

应该考虑国产品牌了!

居益君扬州 19:09

我们是2008年的,开始有小故障,核心业务不敢大意。@泡茶为生(欧阳杰) 是的,包括IBM自己也在推一体机。

泡茶为生(欧阳杰) 19:14

@人在旅途 我也在考虑,到底用小机还是x86。用一体机担心被厂家绑架。

史亚香一南京中大 19:29

同上

韩雄 19:49

今天用小机就是落伍!

CHIMA_HIT 19:53

某医疗集团之前是小型机!现在换上PC服务器速度速度反而快速,原因是内存扩大至几百G级。这个要想在小机上扩内存成本巨大

goal 19:55

没办法,前年继续买了小机。目前cpu利用率没超过20%。

CHIMA_HIT 20:01

对于虚拟机的应用,主要扩大内存。

goal 20:02

对,CPU资源基本过剩。

朱小兵 20:06

@韩雄 主任,这就是为什么您主张云计算/::D

韩雄 20:12

对!己经成潮流!

goal 20:14

小机买了,不可能马上抛弃不用。只能在下一波升级再考虑基础设施架构调整。

老爷子 22:48

还是要根据医院预算情况来决定方案。pc服务器和小型机没有可比性,体系架构和操作系统都不一样。目前性价比最高的是双机双柜。所谓虚拟化或云,其软件系统自身的兼容性,稳定性还差些。小型机架构体系和操作系统的稳定性和运算能力是pc服务器无法替代的。

韩雄 23:19

兄弟今天还谈小机架构!需要补课了!小型机销售直线下降!

AA毕煜冰—天行网络 23:29

@老爷子 小型机对运行环境的要求也不是盖的。

老爷子 23:33

@AA毕煜冰—天行网络 和pc服务器一样的环境。@韩雄 实时行要求高的系统还是小机稳定。PC服务器加正版操作系统与小机加免费赠送操作系统价格差不多。

AA毕煜冰—天行网络 23:36

@老爷子 不是吧,对电源,温度,灰尘要求不是一般的高。

老爷子 23:39

买pc服务器多没有考虑正版操作系统的价格。

AA毕煜冰—天行网络 23:40

@老爷子 我们遇到小型机好多莫名其妙的问题。

韩雄 23:41

我们军区实施医云工程一年半时间!十三所医院建设成功,原小机己下马!PC服务器数量平均减少四分之三!稳定性安全性节约性提升很多!信息科可以八小时上下班了!

老爷子 23:41

@AA毕煜冰—天行网络 系统安装配置需要一定水平。@韩雄 虚拟化可以提高机器的利用率。虚拟化软件最大的弱点是虚拟出来的交换机的性能。

韩雄 23:44

价格不是差不多而是降很多!兄弟,技术很易掌握!我们只办了六天培训

老爷子 23:45

小机也可以做虚拟化。

韩雄 23:46

用小机做就是杀鸡用牛刀。

老爷子 23:49

以前PC服务器装windows系统,现在都改成linux了,肯定稳定了,安全了。

韩雄 23:49

我开始也没信心!通过三个医院试点运行成功,很多问题在用中得到答案。 我推荐给你几位实施成功医院:南京 四五四无锡一O一漳州一七五等。一年前就做好了!

AA毕煜冰—天行网络 00:18

@韩雄 有资料深入学习一下?

韩雄 00:20

中国数字医学去年五七八期上有我们十五篇文章!请指教。@朱小兵   看网上数据中心讨论,心寒!很有必要开展云计算技术实现医院信息基础设施建设培训!

赵京湘 09:53

劳动节,劳动最快乐!昨天我的一个幼稚的发问,让大家着实脑力劳动了一把。谢谢大家!强烈建议朱总搞个培训,内容就是医院核心系统基础架构建设与业务连续性及数据安全保障,看看目前医院都有哪些解决方案,优劣各是什么,未来技术的发展还能提供什么更好的选择?我相信这种沟通和交流,一定是能让大家都有所收获的。再次谢谢大家!

朱小兵 09:59

@湘里湘亲 非常好的建议!我们会认真推进!恳望大家支持!

董兴彦丽水市人民 10:12

@湘里湘亲 ,支持!

泡茶为生(欧阳杰) 10:13

支持!

 【精彩点评】

国家卫生监督中心信息二处处长 王 晖:国家卫生监督中心信息二处处长 王晖

其实对灾备的理解,大家还要换一个思路,不见得双机热备就能解决所有业务连续性问题。我们之所以选择双机,主要是预防硬件损坏造成的单点故障,但目前的现状是由硬件故障引发的问题只占所有问题的10%左右,90%是人为误操作引起的逻辑错误(如误删除等),而逻辑错误双机热备是解决不了的,要错一起错;还有一点,双机热备必然带来系统的复杂度,出现问题时,还要判断是否是双机热备的软件出了问题。一般主服务器,考虑上一些集群的手段,如数据库做RAC(如果是ORACLE),接磁盘阵列(不见得存储也做镜像),再搞一台数据库服务器做冷备,定期(在能容忍的中断时间内)从主数据库同步数据,当出现问题时,人工切换,避免逻辑故障。

【 相关术语】(来源:百度知道)

双机热备这一概念包括了广义与狭义两种意义。 

 从广义上讲,双机热备双机容错)就是对于重要的服务,使用两台服务器,互相备份,共同执行同一服务。当一台服务器出现故障时,可以由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续提供服务。 双机热备由备用的服务器解决了在主服务器故障时服务不中断的问题。但在实际应用中,可能会出现多台服务器的情况,即服务器集群。 双机热备一般情况下需要有共享的存储设备。但某些情况下也可以使用两台独立的服务器。实现双机热备,需要通过专业的集群软件或双机软件。
 从狭义上讲,双机热备特指基于active/standby方式的服务器热备。服务器数据包括数据库数据同时往两台或多台服务器写,或者使用一个共享的存储设备。在同一时间内只有一台服务器运行。当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会通过双机软件的诊测(一般是通过心跳诊断)将standby机器激活,保证应用在短时间内完全恢复正常使用。
RAC(Real Application Cluster,真正应用集群)是Oracle9i数据库中采用的一项新技术,也是Oracle数据库支持网格计算环境的核心技术。它的出现解决了传统数 据库应用中面临的一个重要问题:高性能、高可伸缩性与低价格之间的矛盾。RAC是ORACLE数据库自己的集群系统。装RAC的数据库,要先装 clusterware,配置好集群后,从集群的任一节点装数据库,就可以通过rac的集群软件同步到集群的其他节点了。
x86服务器,与平常人们所接触的台式机笔记本类似,采用CISC架构处理器。随着英特尔至强处理器的性能不断提升,业内有种说法是x86服务器有抢占小型机市场的趋势。虽然近年来x86服务器的出货量占整个服务器(包含x86服务器、小型机、大型机)领域的80%左右,但是其市场份额却只有50%。这主要是因为过去在重要的关键业务应用上,小型机向来是首选。
小型机,一种介于PC服务器和大型机之间的高性能计算机,一般认为,传统小型机是指采用RISC、MIPS等专用处理器,主要支持UNIX操作系统的封闭、专用的计算机系统,所以又称RISC服务器或Unix服务器。大型机与小型机的区别并不是很明显,它们与x86服务器的区别主要是在于RAS、I/O吞吐量以及ISA。
Oracle虚拟计算一体机(Oracle Virtual Compute Appliance) 可为任何虚拟x86应用和工作负载提供快速、可重复的软件定义基础架构部署。通过易于部署的集成系统以及其具有云计算所需的扩展性,客户从开启电源到生产仅需1个小时(1),而仅需几分钟时间就可使虚拟机部署就绪。通过与Oracle企业管理器12c实现集成,最新版的Oracle虚拟计算一体机X4-2提高了计算能力,加快了数据处理和云生命周期管理功能。

 

赞(0)

评论 2

评论前必须登录!

 

  1. #1

    看来云架构势在必行了。云计算早搞早受益(@韩雄)

    HIT草根10年前 (2014-05-02)
  2. #2

    看来云架构势在必行了。云计算早搞早受益(

    zhouleyu10年前 (2014-05-03)


未经允许不得转载:HIT专家网 » 医院信息系统业务连续性讨论:双机热备、RAC还是x86一体机?
分享到: 更多 (0)