来源:HIT专家网 作者:某特色医学中心信息科高级工程师孙建平
今年五一假期,我用AI规划了一条小众郊游路线,结果却踩了个结结实实的坑:AI信誓旦旦给出的郊区公交时刻表,实际上是两年前的旧数据;它推荐的“便捷换乘”,那条支线早在半年前就已经停运。最后我在空无一人的站台等了一个多小时,只能打车返程。
这件事让我这个一直在医院信息科探索AI应用的工程师感触很深。我们在医疗行业人工智能的研究中投入了大量精力,但遇到的问题和这次出行踩的坑本质上一模一样:AI在标准化、高数据量的场景下表现亮眼,但一到真实、动态、复杂的业务场景,原生短板就暴露无遗。
许多医院现在使用的电子病历AI质控系统,就像那个只会给过时路线的出行助手:它能精准找出错别字和格式错误,却看不懂临床逻辑;它能批量生成一堆整改提示,却分不清哪些是致命错误,哪些是医生的正常表述;它用几年前的标准“卡”现在的病历,让医生疲于应付、怨声载道。
笔者认为,与其盲目追求“全知全能的完美AI”,不如先认清AI的能力边界。笔者试图从五一出行的痛点中吸取教训、扬长避短,找到一条真正适合医院实际的电子病历AI质控之路。
AI的四大原生短板,医疗场景一个都没躲过
这次五一出行路线规划之所以能把AI“打回原形”,是因为它完美叠加了当前生成式AI最不擅长的所有要素。而这些短板,在电子病历质控中同样表现得淋漓尽致,甚至因为医疗场景的高风险性,后果更加严重。
第一个短板,是天生依赖静态数据,没有实时感知能力。AI的所有知识都来自于训练截止日前的公开数据,它不会主动去获取最新的信息。在出行中,这是过时的公交时刻表;在医疗中,这就是滞后的质控标准。很多电子病历AI质控系统还在用几年前的病历书写规范进行审核,国家已经更新的手术分级目录、新增的传染病诊疗方案,它完全不知道,自然会产生大量误判。
第二个短板,是概率生成机制带来的原生幻觉。大模型的本质是“猜下一个字”,它的目标是生成通顺的文本,而不是符合事实的答案。当数据不足时,它不会说“我不知道”,只会编造一个看起来合理的答案。在出行中,这是不存在的换乘路线;在医疗中,这就是凭空捏造的“病历缺陷”。我们经常看到AI质控系统把“患者一般情况可”误判为“未记录生命体征”,把“术后常规观察”误判为“未记录病情变化”,本质上都是这种幻觉在作祟。
第三个短板,是缺乏因果推理和领域常识。AI能背诵“五一景区会堵车”,但它不知道堵车会导致错过末班车;它能记住“术后24小时要写手术记录”,但它不理解为什么有这个要求,也分不清急诊手术和择期手术的区别。它只会机械地抠关键词、匹配规则,完全脱离临床实际。这种纸上谈兵式的质控,不仅发现不了真正的医疗安全隐患,反而会严重干扰医生的正常工作。
第四个短板,是无法处理多源冲突数据。当网上、站牌、实际运营时间三方不一致时,AI只会随机选一个;当医嘱、病程、检验、检查数据出现差异时,AI也只会简单报错,不会判断哪个是正确的,更不会分析差异的原因。比如检验结果显示血糖升高,但病程中未提及,AI 只会提示“未记录异常结果”,却不会区分是医生遗漏了,还是这个异常本身没有临床意义。
当前AI病历质控的误区:越努力越偏离目标
正是因为没有认清这些原生短板,一些AI病历质控系统走了弯路,陷入了“投入越大,效果越差”的怪圈。
第一个误区,是追求“全量质控”,什么都想管。有些医院把AI病历质控的目标定为“打造完美病历”,从标点符号到治疗方案,要求AI审核每一个细节。结果就是AI每天生成成百上千条提示,其中90%都是无关紧要的格式问题和误判。医生每天要花一两个小时处理这些无效信息,反而忽略了真正可能导致医疗事故的致命错误。
第二个误区,是迷信“大模型万能”,忽视基础数据建设。可能一些医院认为,只要换一个更大、更先进的大模型,所有问题就都解决了。但实际上,没有高质量的数据源,再好的模型也没用。如果本院的质控标准没有整理成结构化的知识库,如果HIS、LIS、PACS系统之间的数据没有打通,如果临床数据本身就存在错误和缺失,AI再聪明也巧妇难为无米之炊。
扬长避短,打造医生无感而不是反感的质控体系
基于上述分析,笔者有如下感受:
第一,AI不是万能的,但也绝不是无用的。就像我们不会因为AI规划错了一次路线就永远不用它一样,也不能因为现在的系统不好用就否定AI在病历质控中的价值。关键是要把AI放在正确的位置上,用它的长处,避它的短处。
第二,AI质控的首要目标,应该是“消灭丙级病历”,而不是“打造完美病历”。我们要把有限的算力和精力,集中在那些可能导致医疗事故、引发医疗纠纷的致命错误上,比如缺主要诊断、缺手术记录、缺知情同意书、医嘱与病程严重不符等。对于错别字、标点符号这些非核心问题,AI可以记录但不强制提示,由医生自行处理。这样一来,AI的提示量会减少90%以上,医生几乎感觉不到它的存在,只会在即将犯严重错误时收到提醒,而不是时时打扰,且医生可以根据自己的需要,随时调阅AI的提醒。
第三,针对AI依赖静态数据的短板,我们可以用检索增强生成技术,让AI实时调取最新的权威数据。建立本院专属的质控知识库,安排专人实时更新国家规范、本院要求和科室特殊规定。AI在进行质控时,优先从知识库中检索最新的标准,而不是依赖训练时学到的旧知识。同时,打通医院各个业务系统,让AI能自动获取医嘱、检验、检查等数据,进行交叉验证。
第四,再好的AI系统也不是一劳永逸的,它需要在实际使用中不断学习和进化。当医生修改了AI的错误提示时,系统要自动记录下来,下次遇到类似情况就不再误判;当质控科医生审核了病历后,系统要学习人类的判断标准,不断优化自己的模型。这样一来,系统用得越久,误判率就越低,也就越贴合本院的实际情况。
以OpenClaw和Hermes Agent为代表的新一代AI产品,正是沿着“数据联通、自主执行、自我进化”的方向深耕探索,为电子病历质控工作提供了全新破局思路。其中,OpenClaw作为“连接一切的AI执行网关”,核心价值在于打破系统数据孤岛,可安全打通院内各类异构医疗系统,使AI摆脱对零散静态数据的依赖,能够实时调取、核验全流程临床动态数据,从源头解决多源数据冲突、信息滞后等问题,实现精准、实时的基础质控;Hermes Agent作为可自我进化的智能体,有效弥补了传统AI不会学习、无法迭代的缺陷,能够基于临床实际场景、医生修改行为、质控审核结果,自主反思优化、迭代质控逻辑,逐步适配科室规范与医生书写习惯,降低误判率,使AI质控工作愈发贴合临床实际需求。
结语
五一出行的一次踩坑,让我明白了一个道理:技术的价值,不在于它有多先进,而在于它能不能解决实际问题。电子病历AI质控的成功,从来不是因为我们用了多么大的模型、多么新的技术,而是因为我们真正理解了临床的需求,认清了AI的能力边界,把它放在了合适的位置上。
作为医院信息科工程师,我们的任务不是去追逐技术热点,而是要做技术和临床之间的桥梁。我们要把复杂的技术,转化成医生能用、好用、愿意用的工具,让AI真正成为医生的好帮手,而不是对立面。只有这样,AI才能在医疗质量管控中发挥出它应有的价值,为患者的安全保驾护航。

精彩不容错过!

我们将尽快与您联系!
【责任编辑:陈曦】
HIT专家网



评论前必须登录!
注册