原创
作者:领医知识岛 2024年05月13日 15:12 3961 阅读过去一年,中国国内的AI大模型行业应用出现了井喷式增长。北京市尤为重视AI的发展,出台了一系列举措,加上得益于拥有丰富的科技资源和创新环境,在AI应用领域已经形成了完整的创新和产业链条。
近日,北京市科委、中关村管委会发布了《北京市人工智能大模型行业应用分析报告》(以下简称《分析报告》),向市场呈现了北京市AI大模型创新应用发展态势,并寻求向全国乃至全球贡献“北京智慧”和“北京方案”。
该《分析报告》以近期举办的北京市人工智能行业大模型创新应用大赛为切入点进行了介绍,聚焦政务、金融、产业升级、医疗、文化教育、智慧城市6个赛道进行了系统分析和阐述。
领医知识岛(ID:LYZSD666)现将《分析报告》关于医疗AI的相关内容摘编如下,供医疗界同仁了解和决策参考。欲获取完整报告,可以点击文末“阅读原文”或者扫描文末推荐领地链接下载查看。
另外,我们领医(专属于医界志同道合者的高端知识社群)产品迭代基本完成,新上架的小程序、APP正处在平台审核中。你可以关注下方公众号,第一时间获取更多干货,还能在公众号菜单栏点击“领医”登录网页端,提前体验玩转领医的快乐。
北京协和、北京友谊提需求
垂类企业开发的医疗AI综合能力更强
《分析报告》介绍了北京市人工智能行业大模型创新应用大赛在医疗领域的两个赛题方向及完成情况。这两个赛题方向分别由北京协和医院、北京友谊医院提出。
北京协和医院提出的方向为——基于大模型的重症医学领域多源知识体系搭建及临床辅助决策。该赛题以提升重症医学领域科研效率和临床辅助决策能力为目标。
它需要参赛企业整合重症医学领域专有的指南、文献等数据,构建重症医疗领域高质量知识库,从文献知识问答、专业知识考试、重症患者辅助诊断三个维度考察行业大模型能力。
该赛题倾向于将大模型作为辅助工具,利用大模型的理解和索引能力为医生的科研工作提供帮助,利用大模型的推理能力提供辅助诊断建议。因此该题目方向需要大模型全面无遗漏地生成内容,从而帮助医生进行判断。
北京友谊医院提出的方向为——大模型驱动的疑难肝病可解释精准诊断平台构建及应用。该赛题以建设面向复杂肝病会诊场景的可解释智能诊疗系统为目标,研发能够实现医生和智能体多方、多轮辩论的会诊方法和平台。
它需要参赛企业构建肝病诊疗智能体,实现对肝脏疾病的初步诊断;增强智能体的学习和辩论能力,实现人机联合诊疗最优决策,提升复杂肝病会诊决策准确率。
该赛题期待大模型能够作为一个专业的肝病医生,在复杂的医疗数据中自动化形成确诊,因此对于大模型的专业性及精准性要求更高。
那么,AI大模型企业提供的解决方案又如何呢?《分析报告》简要介绍了企业给出的解决方案的亮点:数据是决定医疗领域大模型性能的关键要素;辅助诊疗要求医疗领域大模型具备可解释和可溯源功能。
比如,在医疗数据方面,模型训练及测试面临不同程度的金标准数据匮乏,少量错误数据对医疗大模型的不良影响难以评估。
参赛企业充分利用经专家治理的互联网问诊、全流程诊疗、医学科研、医学知识图谱等高质量数据,构建超百亿Token的医学数据集,提升医学领域大模型能力。
当然,长期深耕医疗行业、积累丰富基础医学知识,以及深入了解医疗场景应用需求的企业研发的医疗大模型综合能力更强。
再比如,在辅助诊疗中要求医疗大模型具备可解释和可溯源功能。不同疾病专科的诊疗思路和治疗方式差异大,但共同点是明确诊疗依据,加强诊断准确性。部分参赛企业基于积累的通用医学知识预训练大模型,采用多Agent+ReAct思维链跟随的结构,提升大模型诊断准确性,并补充发现和解释患者可能存在的疾病,得到医疗专家的认可。
场景落地遇重重挑战
在医疗AI领域表现得“尤为突出”
当然,意料之中的是AI大模型应用必然面临一些挑战。《分析报告》就列举了一些:
算力需求持续增长,掣肘大模型落地应用;知识产权、数据隐私与大模型应用之间的最佳平衡点仍在探索中;大模型幻觉问题有所改善,但距离规模落地尚有差距;部分大模型应用处于“可用阶段”,需求方和技术企业协同发力让“可用”迈向“好用”;部分领域积极响应监管需要,对大模型落地提出特殊要求。
AI大模型应用遇到的上述挑战,在医疗场景下基本上都存在,甚至时常体现得“尤为突出”。
比如,大模型训练涉及的数据可能包括一些版权保护的作品,可能需要禁止使用,避免生成侵权回答。然而,面对数量庞大、来源各异、权属不同的训练数据,若采用事先授权许可的方式则过程漫长、复杂且几乎无法落地操作。
在数据隐私保护方面同样如此,它与大模型应用之间的技术平衡点也仍然在探索中,目前还存在一个两难的问题——既要最大限度地保护数据隐私,又要最大限度地发挥大模型的效果。
这种矛盾在政务、医疗和金融领域尤为突出。如何通过开发可信的框架,从而在“既要……又要……”的困难中取得一种平衡,是目前业内讨论的重点方向,仍在探索中。
再比如,金融、医疗、教育等领域在政策、数据隐私、伦理安全等方面有较高监管需要,需求方和技术企业积极响应,在凝练场景、开放数据、模型训练等过程中考虑监管因素,在项目交付时考虑所属领域可能存在的特殊要求。
领医知识岛(ID:LYZSD666)注意到,在此次由北京协和医院、北京友谊医院分别出题的复赛中,就出现了两种数据使用情形。
协和医院赛题方向的复赛所用训练数据集由重症医学领域知识文献、操作指南、专业试题库和入院病历样例四部分组成,不涉及患者临床信息,通过脱敏处理后可供参赛企业带回,进行部署调试。
然而,友谊医院赛题方向的复赛所用训练数据集由友谊医院提供的电子病历、实验室检查指标、腹腔影像数据报告的半结构化脱敏数据组成,因数据保密的相关要求,仅允许参赛企业在医院内部进行私有化部署调试。
“北京方案”给出三个研判、三个建议
《分析报告》对AI大模型在医疗领域的应用进行了研判,给出了三个判断:
医疗领域核心场景重视准确性及可解释性;医疗数据治理面临隐私及标准化的挑战;医疗机构私有化落地成本较高。
比如,诊断场景作为医疗领域的核心场景,需要大模型结果准确、可回溯、可验证。这对技术企业提出了更高的要求。不少技术企业将大模型尝试应用于科研及教学环节,推动医疗AI更快实现应用落地。
在医疗数据治理层面,当前医疗AI产品训练所需的基础数据,均来源于医疗机构在不同时期逐步部署的异构信息系统,不同医疗机构之间的数据仍难以互联互通、共享共用,这些都阻碍了进一步分析利用。同时,对医疗数据的严格管理、保护,都限制了AI大模型在医疗领域的商业化落地。
此外,大模型在资金、时间、算力、硬件设施和环境等方面具有高昂的开发和运营成本。这些无疑都对医疗机构私有化部署医疗大模型增加了难度。
为此,《分析报告》提出了AI大模型在医疗领域发展的三条建议:
一是,从医疗全流程入手,开放有价值业务场景;二是,推动构建北京市医疗大模型公共数据集;三是,大模型技术企业与医院IT解决方案供应商加强合作。
比如,从开放业务场景方面,《分析报告》认为从加快场景落地考虑,在持续推进医疗诊断等核心业务的同时,拓展医疗行业全领域业务场景,从互联网诊疗、诊前诊后全流程管理、科研场景、民营医院入手,鼓励本市大模型团队找准行业或场景数据优势错位发展,探索大模型在医疗领域的商业化模式和产业化发展路径。
再比如,在推动构建北京市医疗大模型公共数据集方面,《分析报告》认为:协同各类主体加快构建高质量的医疗领域公共训练数据集,推动医疗数据泛知情同意,按照尽职免责原则实现数据出院。在有效提升医疗数据的质量方面,《分析报告》也给出了较细致的建议。
此外,关于大模型技术企业与医院IT解决方案供应商加强合作方面,《分析报告》认为:医院通常有固定合作的IT解决方案供应商,其他技术企业全新建立与医院的合作关系较为困难。大模型技术企业需要结合自身的技术特征、目标场景等要素,选择合适的医院IT解决方案供应商进行合作。
多数需求方认可大模型价值
RAG、智能体、多模态技术有明显作用
尽管遇到的挑战重重,但是也不乏一些能够带来信心的信息。《分析报告》就概述了现阶段AI大模型应用呈现出的一些典型特征:
大模型穿越边缘场景,向核心场景挺进;央国企拥抱新技术,加快大模型在产业升级、金融等领域的落地步伐;大模型应用搭建难度下降,“动态行业大数据”成为落地新关键;需求方情况各异,在采购、部署大模型时特色鲜明;大模型安全逐渐受到重视,为可持续发展提供保障。
比如,经过近一年的高速发展,AI大模型在政务、金融、产业升级、医疗等各个领域均有落地应用。在产业升级领域,以知识问答、代码补全等场景为主;在文化教育领域,以内容润色、内容纠错等场景为主;在医疗领域,以医疗文书生成、智能医药问答等场景为主。
上述场景大多为所属领域的边缘场景,不涉及生产、运营的核心环节,也不面向公众或外部客户使用,仅面向内部员工使用。不过,得益于在边缘场景价值的成功验证及其技术演进,大模型也开始向核心区挺进。
在场景价值验证方面,多数需求方认可大模型价值,将计划追加投入。整体而言,大模型技术演进主要包括检索增强生成(RAG)、智能体(AI Agent)和多模态,对扩大大模型应用范围有明显作用。
检索增强生成技术(RAG)主要用于解决大模型幻觉问题;智能体技术(AI Agent)则可以实现大模型应用的能力升级,赋予大模型感知、规划、记忆和使用工具的能力,实现独当一面。
多模态技术则是使交互模态扩展至文本、图片、音频、视频等多种模态,可显著提升大模型应用的产品功能和交互体验,推动大模型应用从可用向好用转变。
(完)
评论