专业咨询
致力推进中国医疗卫生信息化

数据治理从源头做起:基础信息字典

来源:HIT专家网 作者:某特色医学中心信息科孙建平

医院信息化系统有大量基础工作是需要长期开展的,这当中有许多艰苦的工作要做,否则,信息系统产生的数据就有可能成为“垃圾”。本期笔者想谈一谈基础信息字典的问题。

医院的数据字典分类

医院信息系统内存在大量的数据字典表,大致可以分为两大类:基础信息字典、业务信息字典。

1.基础信息字典

基础信息字典具有通用性,在各个医院信息系统中都可以被沿用,最常见的是性别字典、国籍字典、行政区划字典、民族字典等。这些基础信息字典要尽可能地按照国家规范、标准进行设置,进行适当的维护更新。

在实际操作场景中,有些基本信息字典的值存在一定差异,比如婚姻状况字典中用代码表示的离异、丧偶的值不统一,而这一数据的真实性问题在采集时也存在尴尬。

另外,诸如职业分类、职退状态等字典,如果没有按照国家规定的相关要求进行设置,也会对后续的数据统计分析产生很大的影响。

由于基础信息字典的重要性,原则上不要轻易修改基础信息字典。基础信息字典的修改权限,应由信息科进行严格管理和授权。

2.业务信息字典

而业务信息字典具有特殊性,各个医院可以根据自己的实际情况进行设置,最常见的就是科室字典表、用户字典表。这些字典表在一些信息系统中存在无法“停用”的问题,比如科室名称变更后、医护人员离开后,历史信息是不能删除的,而增设“停用”状态标志将会对许多涉及到的软件进行改造,工作量可想而知,所以字典表的信息将直接关系到用户的体验度。

注重基础信息字典的维护更新

基础信息字典的设置关系到数据的规范性,业务信息字典的设置则关系到数据的价值。如果基础信息字典不规范,将从根本上限制了数据的再利用,正所谓“基础不牢,地动山摇”,到后期再去治理,又是一次人力、物力的再投入;而业务数据如果不真实,存在大量逻辑和勾稽关系的错误,也会导致数据成为“垃圾”。

数据是否准确、是否符合规范,还是脱离实际造“假”,这类问题属于管理层关注的范围。医院信息部门应该尽可能保障数据的“准确性”,这就需要在日常工作中注重基础信息字典的维护。

先举一例:信息科工程师都了解,病案首页需要填写手术医生、麻醉医师姓名。如果这台手术是请外院专家操作的,系统一般不能通过下拉框从本院医生名单中进行选择。虽然系统也提供了手工输入方式,但是由于各种原因,被填写成“专家”情况时有发生,造成了数据的不“准确”,而如何处理好这个数据,使之成为“准确”,单靠信息部门是无法完全解决的。

因此,数据的治理不但要从源头做起,更需要医院的各个部门的共同努力,像现在乡村在治理污染河道时普遍推广的“河长制”一样,来落实各级责任,共同治理医院信息数据“长河”。

再举一例:患者基础数据中的出生地和居住地信息是否准确,就已经够信息科工程师们“喝一壶”了。原因是:身份证读取的是患者的户籍所在地,而患者的实际居住地是会变动的。最让工程师困惑的是,这些信息是以代码形式存在于数据库的,而行政区划是会变动的——以上海为例,浦东新区就是由原来的川沙县等区县合并的,这导致身份证号码与现在的行政区划不完全符合。工程师如果直接把身份证号的前三位301转换为“上海市”,第四到第六位104转换为“徐汇区”,采取这种简单的、由数字代码转译到汉字的方式,显然是越来越不准确了。

所以,笔者建议,最可行的方式,还是用汉字形式把出生地、居住地信息等保存到数据库中。在汉字识别技术越来越成熟的今天,关键字的查询检索并不一定要依赖于代码检索。而这种汉字保存的方式一旦被确定为数据规范,由于行政区划变更带来的字典中代码对应汉字关系不确定的烦恼,就可以消除,从源头上保证数据的不失真。

出生地的信息不失真,可以通过汉字保存的方式解决,居住地的信息准确性就更难保证了,因为居住地很可能会经常变更,即便是长期居住在一个地方的患者,也会存在人户分离的情况。在过去三年的疫情核酸检测中,就已暴露出人户分离造成的统计失真问题。这个问题值得各位同仁探讨研究。

在医院信息系统中,最起码有几十个软件在运行,并且一刻不停地在产生各种各样的数据。大量数据的“准确性”,是考验信息科工程师的责任心和严谨性的试金石。数据的“准确性”也将最终决定着医院质量管理的水平。

这篇文章和以后陆陆续续写的文字,都是我在工作中的一孔之见,分享给大家,希望与同行交流并欢迎不吝指正。如果这些文字能给大家的工作带来一点点参考,那就是我最开心的事情。

【作者编辑面对面】

在本文成稿过程中,作者与编辑之间有多次关于稿件主题、写作思路、遣词造句方面的互动交流,现节选其中一段,与读者朋友分享。

作者:向编辑请教“准确”和“正确”这两个用词。网上查阅的信息是这样描述的:都是关于正确性和准确性的形容词,都有与某一标准相一致的意思。“正确”重在事物的性质,强调没有错误;“准确”重在行为方式或效果,强调没有误差或偏差。

个人觉得,信息科工程师要保证数据的“正确”,要真实、完整地在信息系统中记录数据,不丢失、不走样。而这些记录下来的数据是否“准确”、是否合规、是否客观反映了事实本身,是有数据操作者的主观意识在的,也是数据治理或者说数据规范、数据质控的要求。从这个层面上讲,信息部门只要做到数据“正确”,而管理部门需要强调的是数据的“准确”。

不知道我这样的“咬文嚼字”、在编辑面前班门弄斧是不是很可笑,毕竟我是一个技术人员,文字功底又这么差,让编辑们笑话了,但是我确实很想搞清楚这二个词。望不吝赐教。谢谢!

HIT专家网编辑:孙老师您好,钦佩您反复推敲的严谨。

此处,我个人倾向于使用“准确性”。我们理解,信息科工程师的首要职责应该是确保数据记录和访问的客观性、及时性、全面性等。当然,我们也要从技术上尽可能确保数据的正确性。

比如,医生复制黏贴病历出现了错误,也就是导致病历数据并不正确的状况,但系统却准确地将这一错误行为记录下来了。而注重智能化质控的电子病历系统,也在尽可能预防因为复制黏贴导致的常见错误。

以上理解和建议,谨供参考。

【往期回顾】

数据治理从源头做起:患者身份信息的确定

数据治理从源头做起:再谈患者身份信息的确定

下期预告】

《数据治理从源头做起:药品物资字典的维护》

此图片的alt属性为空;文件名为HIT%E4%B8%93%E5%AE%B6%E7%BD%91%E8%AE%A2%E9%98%85%E5%8F%B7.png
关注HIT专家网微信订阅号
精彩不容错过!
寻求“商务合作”请扫码填写需求
我们将尽快与您联系!

【责任编辑:陈曦】

赞(1)

评论 抢沙发

评论前必须登录!

 


未经允许不得转载:HIT专家网 » 数据治理从源头做起:基础信息字典
分享到: 更多 (0)