专业咨询
致力推进中国医疗卫生信息化

厦门大学附属成功医院:DeepSeek大模型医疗场景普惠应用攻坚纪实

来源:HIT专家网 作者:王继伟

为践行“科技赋能医疗”的使命担当,厦门大学附属成功医院技术团队以“人工智能普惠医疗”为目标,自2025年2月7日起,开展为期10天的专项攻坚行动。

在此次攻坚行动中,算力瓶颈成为了横亘在前进道路上的巨大阻碍,面对原有的算力资源不足、系统并发支撑效率低等难题,技术团队积极探索,大胆创新:一方面,紧急调动高性能芯片资源,通过优化硬件配置,对现有计算设备进行升级改造,提升基础算力水平;另一方面,采用较合适的推理引擎,构建多卡协同机制,提高系统并发能力。在突破算力瓶颈的同时,团队通过资源重构、技术突破与模式创新三线并进,成功实现DeepSeek大模型与医院办公及核心业务系统的整合,打造出医疗AI应用的国产化标杆范式,彰显了医院在智慧医疗建设中的开拓精神与攻坚实力。

攻坚历程

1.敏捷部署阶段(2月7日-2月10日)

2月7日:成立攻坚专班,启动服务器利旧改造。面对旧服务器原搭载的T4显卡显存瓶颈,另行调度显存32G的GPU卡进行部署。

2月8-9日:对调度后的GPU卡与旧服务器存在的兼容性问题及时进行技术论证,制定“国产替代+算力重组”双轨方案。

创新实施信创设备跨项目调度,完成基于海光芯片的服务器重构。部署5张海光DCU加速卡(单卡显存32G),同步迁移至国产操作系统,构建国产化算力基座。

2月10日:基于现有算力资源,搭建基于Ollama引擎的DeepSeek-R1 32B模型测试环境,完成本地化部署,并成功实现日常咨询及临床辅助诊断相关等功能验证。

2.性能优化阶段(2月12日-2月16日)

针对用户反馈的响应延迟问题,技术团队通过系统监控(图1)精准定位多卡负载失衡痛点,实施三级优化策略:

图1  DCU卡负载失衡情况

算力扩容:调度DCU加速卡扩至8张,显存增至256G。

引擎升级:采用VLLM(Virtual Large Language Model)推理引擎替换原系统,构建多卡协同计算框架(图2)。

图2  DCU多卡全负载均衡部署

架构重构:开发轻量化前端服务接口,实现与办公系统无缝对接(图3)。

图3 AI助手嵌入办公系统

经72小时连续攻关,系统并发处理能力提升4倍,平均响应时间压缩至3秒内。

3.全域赋能阶段(2月17日)

通过压力测试验证,系统8卡负载稳定在83%-90%健康区间,成功实现:

临床场景全覆盖:深度集成门诊/住院医生站(图4、图5)、电子病历(图6)、药品管理、病理、手术预约及病案管理等系统。

服务流程全贯通:构建问诊咨询、辅助诊断、用药管理、病历质控等智能服务链。

终端应用全适配:完成大模型与国产操作系统兼容性改造,确保办公、临床多环境稳定运行。

图4  AI助手嵌入门诊医生站
图5  AI助手嵌入住院医生站
图6  AI助手嵌入电子病历系统

创新成果

资源整合创新:构建“硬件利旧+算力重组”模式,跨项目调度信创设备,缩短部署周期50%。

技术突破创新:首创DCU异构计算架构,通过VLLM引擎实现多卡并行推理,模型服务效率提升500%。

本次攻坚行动成功打造大模型落地医院应用的“三快”实施范式——需求响应快(12小时问题闭环)、资源整合快(2天完成设备重构)、技术迭代快(5版方案持续优化)。

后续将重点升级模型、建设医疗知识增强系统,通过Prompt工程优化实现临床需求精准响应,逐步完成业务系统的智能化改造,持续释放AI技术的普惠医疗价值。

【作者简介】

王继伟,厦门大学附属成功医院信息科主任、正高级工程师。

此图片的alt属性为空;文件名为HIT%E4%B8%93%E5%AE%B6%E7%BD%91%E8%AE%A2%E9%98%85%E5%8F%B7.png
关注HIT专家网微信订阅号
精彩不容错过!
寻求“商务合作”请扫码填写需求
我们将尽快与您联系!

【责任编辑:陈曦 版式:明超】

赞(6)

评论 抢沙发

评论前必须登录!

 


未经允许不得转载:HIT专家网 » 厦门大学附属成功医院:DeepSeek大模型医疗场景普惠应用攻坚纪实
分享到: 更多 (0)