来源:HIT专家网 作者:袁永福
HIT数据的价值在于数据的内容质量和数据的被引用,两者是相辅相成的。HIT数据的物理存储格式是数据引用的第一步,只有良好的、开放的物理存储格式,才能保证数据互联互通,产生其原有的价值。
笔者有过十几年的医疗信息化行业(HIT)的从业经历,一直在试图发现HIT系统的价值所在。笔者认为,HIT价值主要分为数据的价值和IT系统的价值,其中又以数据的价值为重。本文就HIT系统数据的价值进行探讨。
数据的价值在于相互引用
笔者认为,数据的价值在于数据的内容质量和数据的被引用,两者是相辅相成的。
说到数据的价值可以首先联想到人的价值。在社会环境中,人的价值在于人本身的能力及人脉关系,有时候人脉关系更重要,而人脉关系实际上就是人和人之间的相互引用。高价值的人,会被其他人频繁的引用,比如经常有人引用马云、巴菲特的话。类似人的价值,数据的价值也遵循这种规律。
HIT系统的数据基本上就是病历数据,这里的病历数据是广义的,不仅包含各种门急诊临床文书,还包括各种PACS影像、各种检查检验数据等。
病历数据的质量包括病历质控、存储或传输格式。质控是数据质量的必要非充分条件。
病历数据的引用分为三个步骤:第一步:数据的存储,第二步:数据的传递,第三步:数据在客户端的解析应用。这就是 “互联互通”,整个过程因素复杂多变,本文只讨论技术方面的因素。
数据的传递实现起来比较简单,比如各种前置机、中间数据库、数据上报系统等。相比之下,数据的解析利用做得就不够好,其重要原因就是有大量的病历文档数据物理存储格式不是开放的,也就是说第一步就没做好。
数据存储是根基
数据的物理存储格式是数据引用的第一步,没有良好的开放的物理存储格式,数据即使传递出去了也没法解析利用,也就没法产生价值。这方面目前业界做得参差不齐。
对于医学影像,数据的物理组织格式都采用了国际统一的DICOM格式,这样影像数据的互联互通就比较容易了,各个组织之间的医学影像数据引用比较方便。
对于一些医嘱、护理和LIS等数据,大多存在关系型数据库中的各个字段中,由于都是采用SQL语言来访问,而且SQL语法也有国际标准,因此这些关系型数据库中的数据格式也勉强算得上是开放的,可以做到相互引用,但是工作量会比较繁琐。
而对于医学文书数据的引用,业界做得质量比较低,这一部分的工作也是今后业界最需要关注的重点。
医学文书数据基本上都是由不同类型的电子病历文档编辑器生成的,物理存储格式各种各样,有TXT、RTF、DOC、ODT、XML、HTML以及各种厂家自定义的二进制格式,甚至还有分散存在数据库字段中的格式。有些病历文档文件还被人为加密,第三方无法解析。这种封闭式的病历文书数据即使被引用了也失去了原有的价值。
评论前必须登录!
注册