来源:HIT专家网 作者:苏州市吴中区卫生健康委员会信息中心主任 颜庆
最近几年,很多医疗信息会议都在谈论数据治理。通过数据治理后的医疗大数据能有效提高医疗资源配置的合理性,降低医疗费用支出,控制不合理费用增长,缓解看病难、看病贵,促进医疗改革。
出于对数据治理的兴趣,笔者花了点时间查阅资料,发现其涵盖的主要内容有:元数据管理(包括元数据采集、血缘分析、影响分析等功能);数据标准管理(包括标准定义、标准查询、标准发布等功能);数据质量管理(包括质量规则定义、质量检查、质量报告等功能)。而数据治理底层技术主要包括数据采集、数据存储和数据计算等。
在学习和实际工作中可以看到,上述“元数据”是医疗信息系统已经产生、上传或者交互到数据库的内容,能做修改的不多;“数据标准”一般都是由相关部门制定,对于基层而言,“拿来主义”比较实际;而“数据质量管理”,基层大有文章可作,尤其是数据质量检查才是基层的工作重点,笔者称之为“源数据管理”。数据源头才是我们需要花大力气去做的事情。就像治理污水一样,如果只管河水不管源头,谈何治理?
如何才能提高源头数据的质量?从笔者的工作实际出发,苏州市吴中区的全民健康信息平台从2014年启动建设,目前已通过国家医疗健康信息互联互通标准化成熟度五级乙等测评。在这个过程中,我们经历了很多与数据治理相关的工作。建设伊始,平台数据报表与基层医疗机构报表之间存在很大差异,平台对业务功能的支撑能力与业务科室的期望值也有一定差距;同时,各个业务系统数据的互联互通存在“梗阻”,各方面的使用体验都不太好。对于这些问题,比照国家医疗健康信息互联互通标准化成熟度测评标准,我们用了近两年的时间,对平台数据质量问题进行调研和治理。
存在问题
项目初期,我们利用全民健康信息平台对全区范围内的医疗信息系统业务数据进行梳理,发现平台的业务统计报表数据与接入单位的报表数据差距较大,导致平台数据不可信。业务部门反映:平台功能不能满足他们的要求,与实际工作需求有差距。从全民健康信息平台产生的数据与上级平台进行交互时,存在字段缺失、数据字段不一致、标准不统一等现象。
通过分析调研,我们将存在的主要问题大致归纳如下。
1.平台上业务统计报表数据与基层单位差距比较大。
通过对比平台汇总的各医疗单位业务数据,如门诊业务量、挂号量、出入院患者数等,发现数值差距比较大,基本上都是平台数据小于基层数据。尤其是门诊就诊人次数等涉及计算平均值的项目,由于涉及计算的基数,差距更加明显。各项业务数据量或多或少都存在数值上的差距,无法确定到底应以谁为准,可信度不高。
2.平台上各个业务系统展现数据不完整。
在查看平台及各个业务系统汇集的业务数据时,发现其中不少数据存在缺项,或者查不到具体明细,导致出现项目空白。有的是全部单位都没有,有的是部分缺失,导致数据展现“缺胳膊少腿”,在数据的综合利用上出现短板,数据质量极差,甚至不能拿来做分析使用。
3.业务部门之间数据不一致。
平台上存在各个业务系统,同时也存在各个业务系统的数据交换。在平台的页面展示中,发现平台业务数据与具体业务系统数据不一致,具体表现为数值不一致、占比不一致、字段内容不一致等问题,甚至有时连具体的个人信息内容也会出现两个业务系统不一致的现象,从而导致相关部门对业务开展存在顾虑。
4.业务协同数据不合医学常理。
由于前述情况,平台统计的一些涉及医疗业务的具体数据,如疾病谱、当季高发疾病、药品使用排名、医疗机构诊断疾病排序等,与一般流行病调查、国内常见疾病谱等不一致,甚至部分统计不合医学常理,导致使用者对平台数据存有疑虑。
原因分析
经分析,造成上述问题的主要原因如下。
1.医院相关业务系统缺失、业务系统使用率低。
辖区内医疗机构的信息化建设不平衡,导致业务系统建设存在差异。比如,部分单位缺失某些业务系统,如病案管理、手麻系统等,无法处理相关业务数据。业务系统的数据缺失,是数据完整性上的硬伤,甚至无法通过其他人工方式在平台上进行补录。
还有部分单位建设了相应的业务系统,如心电系统、PACS系统,但是在使用过程中由于使用人员操作不熟练或不规范操作,出现绕过HIS系统开展业务的情况,导致系统缺失部分数据。比如:没有经过HIS登记,或者业务系统登记信息不全,缺失患者身份信息,业务数据就无法与实际病患对应起来,致使平台上的这部分数据成为无效数据。虽然在使用过程中导致的业务数据缺失,可以通过相应的管理措施进行纠正,但也暴露了在项目实施过程中对业务流程规范性的强调不够。
2.各单位业务数据定义不统一。
我们在数据梳理中发现,各医疗机构产生的业务数据上传到平台后,与之前上报给国家卫生统计直报系统中的统计报表数据不一致。这首先是由于数据定义及口径不统一造成的。比如急诊工作量,基层医疗机构由于没有专门的急诊科,会把白班下班后的时间段都作为急诊时间,又因为各单位的作息时间不同,所以无法得到统一、准确的急诊数据。
其次,对数据定义的理解和掌握也有差异。比如门急诊人次数,有些单位出于平均门急诊费用的考量,把体检人次、计划免疫人次都作为门急诊人次,造成统计的数据偏差很大。同时也存在人工干预数据填报的个别情况,比如为了降低均次费用而加大计算基数等。
3.数据上传环节存在问题。
平台对于基层业务单位上传数据的接口和流程设计不尽合理,这一问题对数据质量影响比较大。初期,我们在平台数据上传环节中特别设置了中间交换库,基层业务系统通过接口程序写数据到交换库,同样的,数据采集程序通过读取交换库再写到平台库中。这样一来,就会存在数据字段对照的问题,两个接口都存在这个问题。由于对数据字段的理解不同,数据采集的把握度、数据比对的准确度等有所差异,都会对数据质量产生影响。而且这一环节直接影响到写入平台的数据精准度,会导致后续计算统计结果出现很大的偏差。
4.平台数据整理存在问题。
平台在进行数据处理时,会对数据进行公式计算。由于系统开发的程序员对医疗数据字段的理解不一致,对医疗相关统计指标的理解不到位,以及对各种数据的标准不统一,都会导致计算结果出现偏差。实际上,卫生统计工作对各种指标计算有单独的计算方式及计算公式,对取数也有比较严格的规定,如果开发方的程序员对这些问题不甚了解,只按字面意思去开发程序的话,就会出现很多的错误计算结果。
解决思路
1.对缺失数据进行弥补。
针对上传数据的缺失部分,我们着重从建设系统和规范流程两个方面来共同推进:一是督促医疗机构加快缺失系统的建设工作,通过建设相应的业务系统,弥补数据短板;二是通过检查数据缺失反推业务流程问题,通过查找问题所在,请求医政、财务等相关条线对下属单位的业务进行规范,同时加大使用者的业务培训,促进软件系统的使用率,从而弥补缺失的数据。
2.重新比对数据字段及统计规则。
我们对数据交换中间库以及上传到平台的数据字段进行重新比对,对每一张表、每一个字段逐一核对,对每一条SQL语句进行确认,确保上传字段遵循正确的对照关系。同时,对同一时间段内平台产生的数据报表与医院HIS端产生的数据报表进行比对核查,进而查找相应的差距并反查问题所在,逐步从细节上纠正数据误差。
对平台计算涉及的统计指标计算公式进行确认,按综合医院医疗质量管理与控制指标(住院死亡类、重返类、医院感染类、手术并发症类、患者安全类、医疗机构合理用药类、医院运行管理类)进行分析比对,纠正计算公式与取数的指标条件,重新整理指标和计算公式。此时可以参考《医院IT运维托管学·标杆研究》一书中提供的医学统计指标相关公式。
3.重新调研业务部门需求。
此前,平台的部分统计指标与实际业务情况有出入,不符合业务科室的实际需求,导致平台是使用度及粘度不够。因此,在数据治理过程中,我们更加注重与业务科室进行沟通,对业务科室的需求重新调研,调整原来不合理的业务逻辑和设计思路,以及数据表维度、字段维度等,对统计需求进行改进,增加统计需求维度,合理体现科室业务,满足协同业务数据交换等业务科室实际的使用需求。通过流程再造,完成统计报表部分的需求整理。
4.制定数据考核及管理机制。
通过一个阶段的数据治理工作后,在各业务部门认为数据已经达到可信可用的基础上,我们积极争取领导认可,适时推出利用平台数据进行绩效考核的举措,具体做法是:年初出台考核办法初稿,各单位确认及反馈意见,形成正式稿后下发;年底通过平台数据进行绩效考核。通过此举措,促进各医疗机构关注自身医疗产出数据的质量、内容,以及与平台的数据交互等方面内容,利用考核杠杆持续优化项目,督促自身信息化的建设。
我们建立了数据质量管理机制,每天对各医疗机构的数据传输工作进行反馈(是否上传、完整度如何等),通过平台页面、短信等方式,提醒数据上传质量等内容,督促数据按时上传、及时比对等工作。
实际效果
1.业务交易数据误差缩小。
通过多方面、多维度的数据比对及改进,上传到平台的业务数据质量较此前有了大幅度的优化提升。原始业务交易数据确保准确,各种统计指标才会实现精确度的提升。从近两年平台上传的数据质量来看,误差基本上控制在1%以内。
2.平台数据规范、统计精度上升。
通过规范数据字段、补充数据表等方式,以及与江苏省全民健康信息平台的数据标准进行核对,这对我们区域平台的数据规范起了很大的作用。数据质量、数据字段规范的提升,为平台与各方进行数据交换提供了基本保障。
通过对统计指标、统计公式进行整理,平台统计报表的精确度有了极大提升,很多指标回归理性,没有再出现违反常理的内容,这说明数据治理是有效的。
3.符合业务部门需求。
通过重新调研业务部门实际需求,包括对医政、财务、公卫等条线业务进行梳理,重新开发符合业务部门需求的应用,实现需求的直观展现;通过调整平台BI设计,在业务部门使用系统时能展现他们最需要看到的内容。后续,我们还将继续努力,对业务部门需求功能再次进行细分与整合,把功能进一步做细做优。
通过这两年的数据质量调研及治理工作,平台的数据质量提升了一个档次,逐步从“够用”“能用”,向“好用”推进,与苏州市、江苏省等上级平台的数据交换质量也有了飞跃。近期,我们通过了国家医疗健康信息互联互通标准化成熟度测评五级乙等(区县级),这充分体现了这段时间以来的数据治理成绩。同时,我们也促进了临床业务系统的建设和规范使用,通过应用数据绩效考核等手段,督促医疗机构提高对数据上传、比对、规整等工作的责任心,进一步提升了数据质量。因此,笔者认为:医疗数据的治理要从源头进行,通过业务、技术、管理等一系列手段,让医疗大数据减少偏差,趋于精准。
【责任编辑:晓青】
评论前必须登录!
注册