来源:HIT专家网 作者: 南京都昌信息科技有限公司 袁永福
近期举办的“智慧医院助力公立医院高质量发展学术交流大会”透露,正在修订中的“智慧医疗分级评价标准”提出了对OFD文件格式的支持要求。笔者认真学习了OFD国家标准,并结合医院信息化行业知识,在此谈谈OFD将为医院信息化行业带来的影响。
需要声明的是,笔者研究OFD的时间还不长,在应用方面还不够深入,本文有些观点可能是错误的。如有错误,敬请指正。
初识OFD
OFD是开放版式文档(Open Fixed-layout Document)的英文缩写,是由我国自主研发的文档格式,旨在打破政府部门和党委机关电子公文格式不统一的局面,以方便地进行电子文档的存储、读取以及编辑,实现文档格式的自主可控和跨平台兼容性。
从逻辑上看,OFD是由多个文档元素实体组织成树状结构,如图1所示。OFD将文件内容分散保存到多个文件中,再以ZIP格式压缩打包。我的感觉是,OFD采用ODT的文件组织形式和PDF的文档描述模型,可以说OFD=PDF+ODT。
OFD优点有很多,感兴趣的读者可自行搜索相关信息。结合笔者关注的电子病历业务,在此主要谈谈以下几点:
第一,符合信创要求。OFD是我国自主研发的版式文件格式,具有完全的控制权,战略意义重大,不排除未来全面推广的可能性。
第二,满足统一阅读呈现和精确打印需求。文本型文档可分为流式文档和版式文档:XML、HTML、RTF是流式文档,里面的信息像流水一样不中断地出现,可以人工阅读或者机器阅读,但无法进行精确打印;而版式文档使用逻辑坐标精确描述复杂文档,让文档在不同设备和打印机上都能输出完全一致的呈现效果,非常适合人们阅读和打印。因此,OFD很适合替换PDF,成为跨机构病历共享和病历归档的优选文件格式。OFD和CDA应用场景不一样,适用范围远超CDA,预计能在医疗行业得到快速普及。
第三,打造无纸化的基础。OFD加上电子签章,形成可信的OFD文档,这是病历无纸化的技术基础。据笔者初步了解,江苏省政府部门基于OFD阅读器和电子签章进行无纸化办公,已经历时五年了。“OFD+电子签章”在政府无纸化办公领域中展示了足够能力,将这种能力移植到医院的病历无纸化办公领域,难度应该不大。
OFD的电子病历应用需规避两大不足之处
所谓“不知兵之害者,不能尽用兵之利”。在此,笔者进一步探讨OFD在电子病历应用领域的不足之处,以便充分规避。
1.OFD对机器阅读不友好
OFD不适合机器阅读。举个例子,版式文档的文本行都有两端对齐功能。大多数情况下,一行字符的总宽度是小于纸张宽度的,因此需要将多余的空白宽度尽可能平均分摊到这行字符中间,因此需要将版式文档中的字符串拆分成单个字符。
比如电子病历文档中的一段主诉文本,它的HTML代码可以写成“<input name=”主诉” maxlength=”20″ value=”头痛三天伴呕吐一天” />”,在OFD中可能输出为:
<ofd:TextObject>
<ofd:TextCode>头</ofd:TextCode>
<ofd:TextCode>痛</ofd:TextCode>
<ofd:TextCode>三</ofd:TextCode>
<ofd:TextCode>天</ofd:TextCode>
<ofd:TextCode>伴</ofd:TextCode>
<ofd:TextCode>呕</ofd:TextCode>
<ofd:TextCode>吐</ofd:TextCode>
<ofd:TextCode>一</ofd:TextCode>
<ofd:TextCode>天</ofd:TextCode>
</ofd:TextObject>
对于这样的OFD代码,因为没有可靠依据,软件很难将这些离散字符还原成原始文字。而且结构化字段区域的编号、数据类型等信息也丢失了。
另外,OFD采用多页内容分开处理的方式。当一段连续文本被分页了,这文本被拆开且存储位置在逻辑上相距遥远时,大段文本的自动复原也是困难的。
例如,现病史可保存为如下HTML代码:“<textarea name=”现病史”> 皮肤黏膜及淋巴结:略苍白,弹性较差,面部及两下肢浮肿。无皮疹、血管蛛、瘀点、瘀斑,无皮下结节、肿块、溃疡、疤痕。全身表浅淋巴结均未触及。</textarea>”。
将其输出为OFD时,可能成为两个片段:
在文件【page1/content.xml】中:“<ofd:TextObject><ofd:TextCode>皮肤黏膜及淋巴结:略苍白,弹性较差,面部及两下肢浮肿。无皮疹、血管蛛、瘀点、瘀斑,无皮</ofd:TextCode></ofd:TextObject><此处是一大段页脚内容的OFD代码>”。
在文件【page2/content.xml】中:“<此处是一大段页眉内容的OFD代码><ofd:TextObject><ofd:TextCode>下结节、肿块、溃疡、疤痕。全身表浅淋巴结均未触及</ofd:TextCode></ofd:TextObject>”。
实际上,这里的文本还会由于两端对齐的原因被拆成一个个字符,信息将更为破碎。
在这个例子中,根据两个子目录中的content.xml来完整还原现病史内容,是比较困难和不可靠的。
另外,当文档中有表格结构和隐藏元素时,输出到OFD时也存在信息丢失的问题。
由于以上情况都存在信息丢失且无法恢复情况,使得OFD对机器阅读是不友好的。
虽然从目前情况来看,归档文档被机器阅读的比例还比较低,但随着时代发展,未来机器阅读的比例会越来越高。为了改善OFD对机器阅读不友好的问题,可以利用OFD的内嵌资源文件功能,将原始病历文件嵌入到OFD的ZIP包中,这虽然会增加文件大小,但能解决机器阅读的问题。个人认为,为未雨绸缪,这种功能应该从一开始就加上去。
2.ODF的二进制脆弱性差
所谓二进制脆弱性是一种评价指标,用来评估当文件内容发生随机的二进制字节改变后,其损失的不可恢复的信息量占原始信息量的比例。
XML格式的二进制脆弱性低,很强壮,有少数字节随机改变时,其信息都可能完全恢复过来;PDF的二进制脆弱性普通,几个字节的随机改动会造成一些信息损失,但主体信息大概率能存活下来;OFD的二进制脆弱性很高,由于采用ZIP压缩格式,哪怕一个字节的改动,都可能造成大量信息丢失或者完全丢失。
医院每天都有大量数据被打入“数据冷宫”,这些数据在未来二三十年都将蜷缩在光盘或磁带中“渡过余生”。光盘和磁带都是塑料制品,受机械磨损、压力变形、温度、湿度、氧化、霉菌、微量辐射等影响,随着时间推移,会产生一些随机的字节修改。如果将OFD用于病历数据的长期归档,可能会导致系统中无法恢复的文件逐渐变多,降低了系统可靠性。
如要改善这一问题,比如采用异地容灾备份,会增加成本。因此,医院在建设基于OFD的“数据冷宫”时,要充分考虑到OFD二进制脆弱性差的问题。
OFD对HIT行业的影响
新的“智慧医疗分级评价标准”对OFD文件格式提出了要求,笔者认为,这将对HIT行业带来如下影响。
首先,OFD是国产标准,可以覆盖PDF的主要功能。在当前信创的大环境下,管理层有较强动力通过OFD替换PDF,今后应该陆续有大量医院将OFD添加到信息系统招标参数中。
需要注意,目前市场上也有将PDF转换为OFD的软件模块,能为现有系统快速添加OFD功能。但信创的要求是“应用系统全流程、全环节的信创”,而不仅仅是“最终结果符合信创”。如在软件流程中使用PDF作为中间产品,再转换为OFD,严格来说并不符合新的评级标准添加OFD要求的“初心”;只有系统根据业务数据直接生成OFD文件,才算符合评级要求。
其次,可以预见今后大量的医院信息系统需要添加对于OFD的支持。相对于开发资源丰富的PDF,OFD的开发资源比较匮乏,需要HIT企业投入不少的研发资源。在这种情况下,大企业尚且能调动足够的研发资源,快速响应;若无外力帮助,中小企业在OFD方面将会落后,可能会遭遇招标参数的“卡脖子”。
另外,外界一些成熟掌握OFD的软件公司(WPS、书生电子等)可能将涉足医疗信息化行业。这些都会对未来的市场格局带来一些影响。
对于我们南京都昌公司而言,一言以概之:“是时候展现真正的技术了”。南京都昌公司长期专注于病历文书相关研发工作,对于版式文档的底层算法了如指掌。因此,我们有信心成为首批独立自主研发出OFD功能的原生HIT企业,并赋能所有合作伙伴,帮助将OFD功能向全国医院快速普及。
【作者简介】
袁永福,男, 80后,南京都昌信息科技有限公司联合创始人,中国医院信息化领域知名软件技术专家,长期从事电子病历编辑器等行业核心技术的研发和推广,一直为整个医信行业的价值最大化而努力。
【资料链接】
OFD(Open Fixed-layout Document)格式,是我国自主研发的电子版式文档格式,旨在满足电子文档在版式、格式和内容上的固定需求,确保文档在不同设备和平台上的显示效果一致性。国家标准《电子文件存储与交换格式—版式文档》(GB/T 33190-2016)对OFD进行了定义与要求。
OFD具有开放性、可扩展性、安全性等特点:OFD格式是一个开放标准,任何单位和个人都可以参与制定和完善;OFD格式支持多种数据类型,包括文字、图形、图片、音频、视频等,且具有良好的可扩展性;OFD格式通过采用先进的加密技术和数字签名技术,确保电子文档的安全性。
自发布以来,OFD文件格式在数字票据、数字公文、数据交换、数字档案管理等方面的应用日益广泛。
【责任编辑:陈曦】
评论前必须登录!
注册