Page 5 - 区域医疗大数据白皮书
P. 5
• Intel 的集群管理工具和安装工具简化了 Hadoop 的安装和配置。可以根据用户的硬件环境自动生成最优化的集群配置, 充分发挥集群的计算能力。 • 基于 Intel 在云计算研发上的经验积累,提供从项目规划到实施各阶段专业的咨询服务,帮助客户构建高可扩展高性能的 分布式系统。 • 结合 Intel 的硬件平台,提供全面的软硬件解决方案设计。 Intel® Manager For Hadoop*软件 部署、配置、监控、警报和安全性 Pig* Hive* Sqoop 协调 脚本 Mapreduce 类 SQL 查询 HBase* 分列存储 Flume 日志收集器 Zookeeper* 协调 分布式处理框架 HDFS* Hadoop 分布式文件系统 图 2 英特尔 Hadoop 发行版 用友区域医疗平台大数据应用案例 的中等规模城市,其卫生数据中心的规模在 20 年后预 锦州,户籍人口规模约 310 万,辽宁西部城市群区域性 计会达到 PB 级: 中心城市和重要港口城市。2012 年 3 月,锦州市政府正 • 传统关系型数据在大数据存储实现中存在局限性,在一 式启动“健康城市”战略。建立以城市为单位建设的区域 张表中存储 500GB 之上的数据存在性能方面的问题。 卫生数据中心,以居民健康卡为纽带,覆盖卫生信息化的 数据类型复杂多变 主要业务领域,存储的数据将包括居民健康档案、电子病 锦州的区域卫生数据中心,将会存储大量的非结构化数据 历、公共卫生及综合管理等相关数据,20 年左右的数据 和半结构化数据。如果采用传统关系型数据库,则面临众 量预计会达到 PB 级。随着“健康城市”理念的提出,个 多不易解决的问题: 人健康数据将伴随着居民对于个人健康的关注,以及健康 管理相关服务的推广而大幅增加。 • PACS 影像,B 超、病理分析等业务产生的非结构化数 据大小不一,从数百 KB 到数百 MB 都有,病人的一次 挑战 诊断活动中需要存储、调阅数百张影像数据; 用友医疗卫生信息系统有限公司 ( 简称:用友医疗 ),作 • 临床电子病历数据一般采用符合 HL7 CDA 标准的 XML 为锦州“健康城市”战略区域卫生数据中心的主要建设方, 文件格式,文件格式随着时间变化,会不断的演变; 拥有大量省市级以及区县级智慧健康城市区域卫生解决 • 由于医疗卫生行业的业务复杂性,很难制定统一的数据 方案项目建设的成功经验。用友医疗在采用传统关系型 标准,这就给数据访问和交换带来新的挑战。 数据库在锦州的区域卫生数据中心建设中,逐步发现一 些潜在的建设问题: 另外,未来的数据处理也将面临巨大挑战,譬如未来海量 数据量庞大 数据的存储,备份,扩容等,快速的检索特定数据,以及 • 区域卫生数据中心以城市为单位,将存储健康档案、电 高效的数据交换等等,这也是锦州区域卫生数据中心未来 子病历、卫生管理三大数据库,锦州作为 300 万人口 必会产生的新的需求。 5
   1   2   3   4   5   6   7   8