专业咨询
致力推进中国医疗卫生信息化

朱晨:DeepSeek热下,AI医疗应用仍需冲破四重关卡

来源:HIT专家网 作者:朱晨

【编者按】

DeepSeek浪潮汹涌澎湃,各地医疗机构踊跃接入、积极部署。热潮当前,“冷思考”也不可或缺。本文是苏州大学附属儿童医院信息处处长朱晨发来的思考文章,分为上下两篇,上篇介绍当前AI医疗应用存在的问题,下篇分享对未来AI医疗发展的思考。本文为上篇。

医疗领域正经历着一场由人工智能(AI)驱动的深刻变革,DeepSeek大模型无疑是这场变革的核心焦点。媒体报道显示,DeepSeek已如燎原之火,在近百家医院落地应用,并且还在以迅猛之势席卷整个医疗行业,为传统医疗模式注入新活力。

AI医疗热潮的涌起,让人们对医疗行业的未来充满了无限遐想。AI技术在提升医务人员诊疗效率、优化医院职能管理部门工作效能以及改善患者服务体验等方面展现出巨大潜力。尤其是在患者服务领域,若要实现优质的“智慧服务”,AI的助力不可或缺。它能够为患者提供更加便捷、高效、个性化的医疗服务,如智能导诊、患者随访等,极大地改善患者就医体验。

然而,在这股热潮背后,我们必须保持清醒的头脑。如同璀璨的星辰大海下可能隐藏着未知的暗礁,AI医疗在蓬勃发展的同时,也面临着诸多亟待解决的问题。如果对这些潜在问题视而不见、盲目乐观,一旦问题集中爆发,医疗行业将面临巨大挑战。因此,深入剖析并积极应对这些问题,对于推动AI医疗的健康、可持续发展至关重要。

笔者认为,当前AI医疗应用存在以下问题,仍需冲破至少四重关卡。

一、算法瓶颈待突破

在人工智能技术的蓬勃发展浪潮中,DeepSeek等大模型成功攻克了通用型算法的诸多关键难题,这一突破为整个AI领域的发展奠定了坚实基础,犹如搭建高楼大厦的稳固框架,为各类模型提供了基本架构和运行逻辑,使其具备处理多样化任务的能力。

然而,在医疗垂直领域,算法研究与应用的进展却相对缓慢。目前,公开报道的相关案例屈指可数。尽管部分具有前瞻性的公司与医疗机构敏锐地捕捉到医疗细分算法领域的巨大潜力,并积极展开合作探索,但从行业整体来看,这些努力所取得的成果仍较为有限。医疗细分算法在实际临床应用、医政管理等各个医疗环节中的普及程度依旧较低,尚未能充分发挥其应有的价值。

由于现阶段缺乏成熟完善的医疗垂直领域模型,许多医院在无奈之下,只能选择直接采用通用大模型,并使用其公开数据来满足自身信息化建设、辅助诊疗等需求。但通用大模型的训练数据来源广泛且复杂,公开数据并非专门为医疗领域量身定制,有报道称大模型中医疗数据训练占比不足5%。医院在使用过程中,对大模型已有的训练基础和专业知识库的具体情况知之甚少:大模型训练涉及多领域数据,其中医疗相关数据的占比和准确性难以确定;专业知识库的更新频率和深度也无法精准把握。这种信息的不透明,导致在实际使用过程中问题频发,风险与“幻觉”问题尤为突出。另外,通用大模型虽然已经大量学习了医学知识,但在实际使用中还需要进一步正向和反向验证,以确保知识库的准确度。

即便医院通过数据清洗、模型微调等技术手段,在一定程度上降低风险,但“专业大模型匮乏”这一根本性问题仍未得到有效解决。要想让AI技术在医疗领域充分发挥价值,满足医疗行业对精准性、专业性和安全性的严格要求,就必须加大对医疗垂直领域专业大模型的研发投入,建立完善的研发体系和验证机制,使医疗大模型更加贴合医疗实际场景,为医疗行业的数字化转型筑牢技术根基。

二、算力资源需统筹

从近期媒体铺天盖地的报道中不难发现,在资金条件允许的情况下,众多医疗机构更倾向于引入“满血版”DeepSeek。所谓“满血版”,意味着其具备更强大的性能和更全面的功能,能够为医疗领域的多种复杂任务提供深度支持,如辅助医生进行复杂疾病的诊断、开展医学影像的精准分析等。

然而,大规模引入“满血版”DeepSeek的背后,隐藏着一系列不容忽视的问题。以一个地区为例,若该地区有10家医疗机构均上线“满血版”DeepSeek,仅芯片成本就是一笔巨额开支。因为“满血版”DeepSeek对芯片性能要求极高,往往需要配备高端芯片才能充分发挥其功能,这无疑大幅增加了医疗机构的采购成本。除芯片成本外,其背后所需的电力资源也十分庞大。这些高性能芯片在运行过程中持续消耗大量电能以维持稳定运行,不仅增加了医疗机构的运营成本,还对当地电力供应造成不小的压力。若还需进行进一步的训练和蒸馏操作,所需资源将更为庞大。另外,部分单一大模型能力不足以支撑医疗全流程业务开展,还需要其他大模型的配合使用,解决诸如多模态等问题,多个大模型的应用也对算力配置提出了更高的要求。

与此同时,算力浪费问题也较为严重。由于各医疗机构的业务需求和使用时间存在差异,在某些时段,“满血版”DeepSeek的算力无法得到充分利用,造成资源闲置。例如,夜间医院门诊业务量减少时,相关设备的算力可能大量闲置。

因此,从区域层面统筹算力资源,成为避免浪费、提高资源利用效率的关键举措。通过区域统筹,可以根据各医疗机构的实际需求,合理分配算力资源,避免重复建设。例如,建立区域算力共享平台,各医疗机构可根据自身业务繁忙程度和需求紧急程度,灵活调配使用算力,实现资源的最大化利用,推动AI医疗可持续发展。

三、数据质量存隐忧

在医疗行业,通用大模型的构建和训练依赖丰富的数据支持,其训练数据主要来源于专业教材、公开文献、专家共识、诊疗指南以及医院自身的病历数据等多个方面。

然而,这其中的部分数据在质量方面可能存在问题。

公开文献来源广泛,涵盖不同研究机构和学术水平的成果,质量参差不齐。部分公开文献存在研究方法不严谨、样本量过小、数据不准确等问题,这使得基于这些文献训练的大模型可能学到错误或片面的知识。

医院自身的数据质量同样不容乐观。一方面,不同医院的数据记录规范和标准不一致,存在数据格式不统一、记录不完整,甚至信息错误等情况。比如,有的医院在病历中对患者症状描述过于简单,缺乏关键细节;有的医院在数据录入时出现人为失误,导致数据不准确。另一方面,医院的数据更新速度往往跟不上实际医疗实践的发展,使得训练出的模型无法及时反映最新的医疗情况。

医院大模型的训练结果与医院自身的知识水平、业务和管理水平密切相关,这些因素在很大程度上限制了大模型应用水平的上限。以地市级、区县级医院为例,相较于大型三甲医院,它们在医疗资源、人才储备、科研能力等方面相对薄弱。这些医院的医生专业知识深度和广度不足,临床经验相对欠缺,直接影响医院病历数据的质量和价值。若仅依靠医院自身病历数据训练模型,由于数据的相似性和局限性,容易导致模型训练出现低水平重复,易陷入“自证循环”(如误诊案例被错误标注后反复强化)现象。

目前,受多种因素影响,各医院之间无法完全共享病历数据。每个医院的模型只能基于自身数据进行训练,无法吸收其他医院的优势数据和经验,导致模型的泛化能力和准确性受限。若未来能在确保数据安全共享的前提下,在一定范围内共建大模型,将为医疗行业带来巨大变革,有力推动全社会整体医疗水平的提升。

四、伦理安全引关注

当前,各医疗机构的AI医疗采用了公网接入、算力租用或者本地化部署等方式来解决。这些方式需要避免数据泄露风险,避免外部网络攻击带来的数据安全威胁,避免如开源跨平台大模型工具Ollama默认配置存在未授权访问与模型窃取等安全隐患,为患者隐私保护和医院正常运营提供安全保障。

另外,AI大模型在医疗领域的应用也引发了一系列伦理层面的思考。在医疗行业,医生的临床思维和专业判断是诊疗过程的核心环节,它基于医生多年的专业学习、丰富的临床实践经验以及对患者个体情况的综合考量。随着DeepSeek等大模型在医疗领域的广泛应用,必然对传统医学思维逻辑方式产生巨大冲击。虽然大模型通过大量数据训练,在医学知识考试中可能表现出色,能快速准确回答各类医学问题,但它并不具备真正的行医资格,AI还不能确定作为法律主体,AI医疗责任认定还缺乏法律依据。医学不仅是一门科学,更是一门关乎人性和生命的艺术,医生在诊疗过程中需要与患者进行情感沟通、给予人文关怀,这些是大模型无法替代的。大模型给出的只是基于数据和算法的分析结果,缺乏对患者个体差异、心理状态等方面的深入理解,无法像医生一样根据患者实际情况做出灵活、全面的判断。

目前,国家卫生健康委虽暂未出台针对医疗机构规范使用大模型的明确政策,但参考互联网医院的发展历程,相关规范政策预计将会逐步出台。互联网医院发展初期,也曾面临医疗质量监管、信息安全保障、诊疗规范界定等诸多问题。随着行业发展和问题暴露,国家相关部门及时出台政策法规,对互联网医院的准入门槛、运营管理、监督机制等进行明确规定,促使其走上规范、健康的发展道路。基于此,针对医疗机构使用大模型的相关政策也将从数据安全管理、医生使用大模型的规范、大模型在医疗领域的应用范围界定等多个方面进行详细规定,为医疗机构合理、安全、规范地使用大模型提供明确指导和约束,保障医疗行业在AI技术助力下健康、有序发展。

(下期预告:对未来AI医疗发展的思考。敬请读者朋友关注!)

此图片的alt属性为空;文件名为HIT%E4%B8%93%E5%AE%B6%E7%BD%91%E8%AE%A2%E9%98%85%E5%8F%B7.png
关注HIT专家网微信订阅号
精彩不容错过!
寻求“商务合作”请扫码填写需求
我们将尽快与您联系!

【责任编辑:陈曦】

赞(3)

评论 抢沙发

评论前必须登录!

 


未经允许不得转载:HIT专家网 » 朱晨:DeepSeek热下,AI医疗应用仍需冲破四重关卡
分享到: 更多 (0)