9月8日,腾讯健康公布医疗大模型,全新发布智能问答、家庭医生助手、数智医疗影像平台等多场景AI产品矩阵。腾讯健康总裁吴文达指出,医疗健康的数智化升级已从“先行先试”,转变为“全面拥抱”,“大模型所具有的生成能力,很大程度上将是医疗行业变迁的前兆”。至此,大模型在医疗垂直领域的“百模大战”中再添一员。新技术带来“AI医生”升级,未来医疗将会发生哪些改变?医疗大模型落地前行还有哪些瓶颈?
●南方日报记者严慧芳
巨头纷纷入场医疗大模型
“医疗应该是人工智能(AI)落地的最佳领域,我们经常开玩笑说,AI在其他领域可能是锦上添花,但在医疗领域是雪中送炭。”迈瑞医疗集团研发副总裁李新胜表示。9月8日,在2023腾讯全球数字生态大会上,迈瑞医疗与腾讯健康达成战略合作,双方将依托云计算、医疗大模型等数字技术,携手推进医疗器械产业的数智化升级。
两大巨头的合作始于八年前,双方在体外诊断领域联手共同研发的“全自动外周血细胞形态学分析仪”,极大地提升了阅片的准确率和整体效率,打破了阅片机市场仅有一家进口品牌“独大”的局面,成为“医疗+AI”融合创新的标杆。
你有酒,我有诗,跨界合作似乎是人工智能新一波浪潮的标配。李新胜表示,双方将在腾讯擅长的大语言模型以及云计算等方面开展更深入的合作,不仅局限于体外诊断,还将拓展到重症、急诊、麻醉等临床科室,输出更多有临床价值的成果。
在此之前,7月8日,广州金域医学与华为云也宣布进一步深化合作,并正式签署盘古大模型战略合作协议,双方将合力打造医检行业AI大模型,驱动医学检验全链条多场景的智能化。
7月13日,京东健康正式发布面向医疗健康行业的大模型“京医千询”,是建立在京东言犀通用大模型基础上,覆盖全流程医疗需求、实现智能决策、支持多模态的医疗大模型。
更早一些,5月25日,医联正式发布自主研发的基于Transformer架构的医疗大语言模型——MedGPT,宣告可以通过循序渐进多轮问诊引导患者收集足够的诊断决策因子后保证有效诊断。一个多月后,MedGPT与真人医生进行一致性评测,结果显示,AI医生与三甲主治医生在比分结果上的一致性达到了96%。
不完全统计显示,目前在医疗领域,国产大模型数量不少于40个,互联网巨头腾讯、百度、京东等已经纷纷下场,涵盖药物研发、智慧诊疗、医疗设备运维、医院管理等多个领域。
大模型能为医疗带来什么
或许是“好饭不怕晚”,相比之下,腾讯的大模型发布有些姗姗来迟。
腾讯杰出科学家、腾讯天衍实验室主任郑冶枫介绍,医疗大模型的研发,基于腾讯全链路自研混元大模型,这一基座模型拥有超千亿参数规模和超2万亿tokens预训练语料,具备强大的中文创作能力、复杂语境下的逻辑推理能力以及可靠的任务执行能力,在此之上,持续加入涵盖285万医学实体、1250万医学关系,覆盖98%医学知识的医学知识图谱和医学文献,使大模型进一步掌握专业的医学知识。经过3000万覆盖患者、医生、药厂等场景及医疗流程的问答对话进行多任务微调,以及36万组专家医生标注数据的强化学习,让腾讯的医疗大模型在处理医疗需求时更专业、精准,“同时也兼顾了患者关怀,更接近人类医生”。
目前,腾讯医疗大模型包括文案生成、智能问答、病历结构化和检索、影像报告和辅助诊断等场景大模型,可嵌入医疗环节全流程,在科室导诊、医生推荐、预问诊、医患对话、病历自动生成和智能院务客服等应用场景中。
传统AI辅助问诊工具已经大范围应用于医疗领域,尤其以影像识别为代表的AI医疗产品,频频获批成为医生好帮手。但如果AI医生的能力已经进化到问诊、开方、治疗、康复的全流程,未来的就医场景是否会发生根本性变革?
贵州的村医李医生,上门随访瘫痪的老人,这位老人下肢有水肿,该如何治疗?李医生在AI辅诊的帮助下,按照专科医生的问诊流程,详细、结构化地询问了老人的发病情况、不适症状,系统自动生成标准化的初诊记录。村医通过腾讯会议把病历总结发给三级医院和县医院医生做诊断确认,最后确认这个病人需要去医院接受正确的治疗。
这是AI医生在现实应用的真实场景。“像李医生手里的AI辅诊工具,目前已经成为当地50家村卫生室、近200位村医的日常工具,也开始在贵州其他地区拓展使用。”腾讯健康总裁吴文达介绍。
人工智能在医疗领域被认为是刚需,能够提高医生效率,满足更多患者需求,面对的是全球共同的难题:医患比例严重不足。
但与通用大模型不同的是,医疗大模型聚焦严肃且谨慎的医疗场景,天然对错误的容忍度更低。这也要求医疗大模型的准确性和安全性必须更高。
“‘沃森医生’的定位过于激进,代替医生做决策,是失败的主要原因。”李新胜表示,很长一段时间,人工智能、大模型的定位都会是医生的得力助手。
“目前很多医院实际上已经在应用人工智能辅助,而大模型的出现带来人机自然语言的无障碍交互,可以调动多种能力解决多个场景的问题,预计未来一两年,基于大模型的AI医疗应用会越来越多。未来,不仅在医院,AI家庭医生也能帮你做初步诊断、推荐就诊专科、分析检测报告等,想象空间是无限的。”金域医疗集团副总裁李映华表示。
人工智能进化面临数据瓶颈
原材料不好,再好的厨师也做不出好菜。如果把大模型技术看作技艺高超的厨师,高质量的数据就是不可或缺的原材料。
沙利文发布的《医疗智能行业白皮书》预测,2030年,中国医疗智能行业规模有望超过1.1万亿。跨越式发展的AI医生,给行业带来巨大的想象空间。不过,AI医生的进化,海量数据或成为最大瓶颈。
“前段时间去欧洲跑了一个月,发现我们医检领域与人工智能融合发展方面,还有很大差距,我们的数据质量比不上人家。我们的样本量大,但数据量大不是大数据。”9月12日,在2023“域见杯”医检人工智能开发者大赛上,金域医学集团董事长兼首席执行官梁耀铭发出感慨。
随着人工智能大模型渗透进千行百业,对开发者而言,产业实践已成为衡量模型价值的重要标准。梁耀铭指出,医检人工智能的发展,面临数据、算法、算力三大挑战。人工智能开发需要大量高质量数据,而国内大部分医疗数据存储于各级医疗机构,业务系统相对独立,数据较难实现共享,存在明显的“数据孤岛”现象,可供训练的真实场景数据集有限。
即便得到了大量的医疗数据,如何对离散的海量医学专业数据进行处理、统计和分析,通过模型进行有效的整合,是另一个挑战。特别是,医疗行业的严谨性对模型的精确度要求更高,从而对算法和算力提出了更高的要求。
最后,开发出来的医学人工智能成果存在规模化落地的困境,数据与算法模型的产、供、销缺乏产业链资源支撑,都成为制约医检人工智能进一步发展与落地的重要因素。
“医检人工智能行业急需一个专有的平台,满足个人及企业开发者对训练、开发、应用和分享的需求。”为解决以上痛点,金域医学利用所拥有超10PB数据量的全球领先的东方人种大样本、大数据库,积极开展数字化转型工作。2020年,广东省科技厅发布第三批“广东省新一代人工智能开放创新平台”名单,金域医学正式承建“临床检验与病理诊断广东省新一代人工智能开放创新平台”。9月12日,这一平台正式上线。
“这是中国医检行业首个人工智能开放创新平台,具备全栈、全流程、全场景的特点。我们希望通过这一平台,带动数据、技术、产业链资源整合,输出医检人工智能核心研发能力和服务能力,以海量医检数据服务和开放AI技术服务,推动形成医检领域人工智能产业集群。”金域医学副总裁梁小丹表示。
据悉,通过算力、算法、数据、模型共享,该平台可向创业公司、医疗科研机构、个人开发者、行业专家等用户提供服务,满足了开发者从数据训练到人工智能应用部署的全流程开发需求,包含数据处理、开发训练、模型管理、在线部署等。开发者可以在平台上使用公开数据集进行模型训练;也可获得普惠价格的算力,支撑数据处理、各类模型的开发。此外,平台一站式模型训练服务,为用户提供主流算法框架和开发框架、丰富的算力资源及合规可用的训练数据,最大限度地降低研发成本,吸纳产业创新资源集聚。
“过去医疗数据收集是一个壁垒,这几年随着IT技术的发展,医院无论从日常护理、电子病历到设备数据都是打通的,没有太大难度。难度在于数据的清洗、数据的挖掘。”迈瑞医疗李新胜认为,这些数据如果不能清洗,有效剔除干扰,就不能把精确的结果提炼出来,再好的模型都没有用,所以这才是最大的技术障碍。“迈瑞过去十年来最核心的竞争力就是在数据的收集、清洗、挖掘这方面,有了大模型技术再做智能化的应用,就像炒菜一样,原材料好,再加上高超的厨艺,就能做出一盘好菜。”