橘子百科-橘子都知道橘子百科-橘子都知道

国内首个脑血管专病大模型亮相 对话参与医生:被AI“上了一课”

国内首个脑血管专病大模型亮相 对话参与医生:被AI“上了一课”

  每经(jīng)记(jì)者(zhě) 林姿辰    每经编辑 张海妮    

  距离谷歌大模(mó)型(MedPaLM 2)拿(ná)下美国医(yī)学执照考试(shì)已经快两年了,人(rén)工(gōng)智能(AI)够资格成为临床医生的“假(jiǎ)想(xiǎng)敌”了吗?

  今年7月,一篇(piān)发表(biǎo)于Nature Medicine的论文显示(shì),即使是目前(qián)最先进(jìn)的大语言模型(LLM)也(yě)无法为(wèi)所有患 者作出准确(què)诊断,且(qiě)诊断正确率(73%)明显差于人类医生(89%);在极端情况(kuàng)(胆囊炎诊断)下,LLM的正确(què)率仅为13%。

  但对于北京(jīng)清(qīng)华长(zhǎng)庚医院神经中心医师邳靖陶来说,他今年刚被AI“上了一课”。8月下旬,邳靖陶参与的灵犀(xī)医学脑血管病专(zhuān)病大模型正式发布,该模型由其所在医院的神经(jīng)中心(xīn)武剑教授团队主导研发,是(shì)国内首个基于(yú)专(zhuān)病的医学人工(gōng)智能模型。

  “大模型的 能力说强(qiáng)也强,说弱也弱,我们不(bù)能让它天马行空地自由发(fā)挥。”邳靖陶表示,专病大模型与ChatGPT的(de)最大不同,是要将AI杜撰(zhuàn)的似是(shì)而非的诊疗建议扼杀在(zài)摇篮里,避免(miǎn)灾难性(xìng)后果。

  8月下旬,灵(líng)犀医学脑血管病 专病(bìng)大模型正式发布,该模型由北(běi)京清(qīng)华长庚医院(yuàn)神经中心(xīn)武剑教授团(tuán)队主导研发(fā),是国内首个基于专病的医学人工智能模(mó)型。图为(wèi)灵犀医(yī)学大 模型技术交流会现场。 受访 者供图

  对标(biāo)专科和专病专家

  作为国内(nèi)四大慢病之一,脑血管病的(de)首次发病者(zhě)约有三分之二是(shì)60岁以上的老年人,其具有“高发病率、高患病率(lǜ)、高死(sǐ)亡率(lǜ)、高复发率”的特点。而截至2021年(nián),我国65岁(suì)及以上的老年人口已经超(chāo)过2亿人,脑(nǎo)血管病医生短缺、水平参差不齐的问题尤为(wèi)突出。

  “基层 医院不缺(quē)全科医生,但缺专(zhuān)科专家或专病专家(jiā),这就(jiù)是大模(mó)型要解决的(de)问题。”邳靖陶介绍,脑血(xuè)管病专病大(dà)模型是医(yī)疗机构与科技企业的(de)合作产物。具体来说,新华(huá)三集团提供技术人员、AI算法和(hé)算力,北京清华长庚医(yī)院和清华大(dà)学提供(gōng)大数(shù)据和临床需求(qiú),共同打造(zào)一(yī)款面向临床医(yī)生的辅(fǔ)助(zhù)诊断工具。

  武剑教授曾表示,医学人工智能在缓解医疗(liáo)资源紧张和提升医 疗服务水平方面,具有巨大的潜力和(hé)优势。其核心在于对海量健(jiàn)康数据的深度挖掘和智能分析,这能够大幅提升临床(chuáng)诊断(duàn)和治疗的(de)准确性(xìng)与效率。

  目前,这个(gè)大模型的核心功能是分析(xī)和提取病历中的关键信息,并与临床知识(shí)库(kù)相匹配,最终提供符合(hé)临床指(zhǐ)南的标准化治 疗建议。

  一(yī)方面,临床医生可(kě)以输入脱敏(不(bù)包括(kuò)患者个人信息)的临床病(bìng)程信息,由(yóu)大模型生成(chéng)最终(zhōng)的(de)治疗方案。其间,如果大模型察觉到病程信息存在(zài)疏漏,会提(tí)醒医生及时(shí)补充,保证病历记录的标(biāo)准化。

  另一方面,临床医生也(yě)可以输入患者主诉 (如(rú)主要症状和持续时间等(děng)信息)等简单信息,大模型将通过选择性交互引导问诊(zhěn)方向,根据医生点击的选项,逐步完善临床诊疗过程(chéng),提升医生的循证能力。

  专业性体现在两(liǎng)方面

  在邳靖陶看来(lái),与(yǔ)ChatGPT等通用大模型相比,专病(bìng)大模型的专业性体现在思维链和知识库两方 面。以脑血(xuè)管病专病大模型为(wèi)例,其数(shù)据来源包括(kuò)两大部分:一 部分是经过脱(tuō)敏处理(lǐ)的临 床资料,涉及疾病的特定特征,发病情况以及诊疗过程等综(zōng)合信息。另一部(bù)分是公开获(huò)取的临床(chuáng)指南、大量神经 病学和神经科学的教科书和(hé)参考(kǎo)书(shū)籍,这些(xiē)构(gòu)成了数据库的核心(xīn)内容。值得注意的是,大模型并不能(néng)直接接收这些知识(shí),而是需要经临床医生和(hé)工科团队之手(shǒu),将(jiāng)临床(chuáng)指南的框架和重(zhòng)点内容(róng)重新整理(lǐ),转化为计算机能够理解的语言和流程后,再输给大模型。

  “如(rú)果不加限制地直(zhí)接投喂(wèi),大模型会发散到其 他方面,生 成一些新(xīn)的理解。但临床指 南(nán)已经是最高(gāo)级别(bié)的标(biāo)准化诊疗推荐,在此基础上的任何修(xiū)改都是(shì)错误的,也(yě)不(bù)是我们想要的。”邳靖陶告诉记(jì)者,想让大模型“听话”,除了要(yào)投喂计算(suàn)机能“听(tīng)懂”的知识(shí),更(gèng)关键 的是教给它(tā)一套临床医生的(de)“思维(wéi)链”,并依托(tuō)这一能力对不(bù)同患者的临床 资料进行推理。

  例(lì)如,一位脑血管病医生(shēng)的诊(zhěn)疗(liáo)流(liú)程大致包括询问(wèn)病史,进行体格检查,考虑辅助(zhù)检查,综合分(fēn)析后给出准(zhǔn)确诊断等环节。基(jī)于诊断结果,医生会(huì)考虑(lǜ)患者的具体病因和其他基础疾病情况,结合标准化的诊疗建议,制定规范化(huà)的治疗方案。

  在这个过(guò)程中,不同 的(de)患者主(zhǔ)诉指向不同的询问方(fāng)向。但问题是,大模型的思维虽然“发散(sàn)”,但不(bù)具备自主搭(dā)建思维链的能力,所以需要工科(kē)团队深刻理解临床诊疗场景,将医生的临床思维转换为机器可以理解(jiě)的思维。而(ér)这个过(guò)程让临床医生和(hé)技术(shù)团队(duì),都经历(lì)了(le)交叉学习的历练。

  “Gap(差距)主要是语言交流上的障碍,比如我们不理解思维国内首个脑血管专病大模型亮相 对话参与医生:被AI“上了一课”国内首个脑血管专病大模型亮相 对话参与医生:被AI“上了一课”链,他们不理解不同疾病间的关系。但这不会对我们的研究造成实质(zhì)性影(yǐng)响,只要了解对方领域的基础知识(shí),就能扫清困(kùn)难。”邳靖陶说。

  负责的仍是临床(chuáng)医生

  邳靖陶透露,目前脑(nǎo)血管病专病大模型正在北京清华长庚医(yī)院神经中心进行临床验证(zhèng)。此前,他(tā)和同事们使用真实病例或模拟复(fù)杂临床场景(jǐng),对大模型进行过内部测试。这项测试建立在前期简单测试的(de)基(jī)础之上,旨在评估大模型(xíng)对不同 复杂程度、不(bù)同语言风格和不同级(jí)别医生的病历(lì)的(de)理解(jiě)能力。

  其中,最困扰(rǎo)邳(pī)靖陶的(de)一个问题是,如果大模型出现了错(cuò)误,怎么保证临床医生不(bù)受干扰(rǎo)呢?换言之,临床医生应(yīng)该怎么处理和大模(mó)型之(zhī)间的关系?

  这一矛盾在首(shǒu)次内部测试时就(jiù)出现了。当时,邳靖陶模(mó)拟(nǐ)了一个复杂的临床场景,大模型给出的治疗方案和预想的(de)“标准答案”有所出入。随后,技术人员(yuán)介(jiè)入(rù)并回溯了大(dà)模型的推理过程,试图找出可能的错误,却无功而返。而当(dāng)邳靖陶用“标准答案”去匹配临床 指南(nán)时,让他(tā)印象深刻的(de)结果出现了:是自己(jǐ)的诊(zhěn)疗思路存在盲区。

  “一开始这个模型设计出来,到底能不能用(yòng)于临床,能不(bù)能起到提升和改善 (诊疗(liáo)效率)的作用,其实我心里也没(méi)有底(dǐ)。但是这件事之(zhī)后(hòu),给了我特(tè)别大的底(dǐ)气。”邳靖陶总结这次经历,发现患(huàn)者的(de)临床症状是一个(gè)综合结(jié)果(guǒ)。例如 ,患者(zhě)可能因为神经系统问题住(zhù)院,但心血 管、肾(shèn)脏、肝脏状况也在发生变化。尽管医生接受过规范化的专科培训,但诊疗思维仍可能(néng)存在(zài)盲点,无法保证每次都能(néng)提供全面的诊疗方案。

  另外,临(lín)床指南是不断(duàn)更新的,并非(fēi)所有医 生都能及时更新知(zhī)识。当医生的知识更新滞(zhì)后时,大模(mó)型可以(yǐ)帮助弥补这(zhè)些纰(pī)漏。

  不过(guò),阅读指南(nán)并(bìng)作(zuò)出判断(duàn),仍是临床医生(shēng)不能丢(diū)弃的(de)基本(běn)功。邳靖陶表示,如(rú)果医(yī)生发(fā)现大(dà)模型提供的(de)诊疗方案与自身判(pàn)断不符(fú),不应简单地接受或拒(jù)绝,而应深入探(tàn)究原因(yīn)。这(zhè)一思(sī)考(kǎo)过(guò)程有助于医生(shēng)提高(gāo)临(lín)床诊疗能力,是大(dà)模型(xíng)作为临床辅助诊断(duàn)工具的终极愿景。毕竟(jìng),虽然大(dà)模型可以提供结论,但(dàn)对(duì)诊疗过程负责的仍是 临床医生本人。

  呼(hū)吁更多人加入

  2023年7月,谷歌(gē)Research和DeepMind共(gòng)同打造的全球首个全科医疗大模型Med-PaLM M正式发布。资料显示,这个(gè)大模型 具备临(lín)床语言(yán)、影像和基 因组学的理解能力(lì),用(yòng)于临床(chuáng)指日可待。

  而根据《2023医(yī)疗健康AI大模型行业研究报告》,截至2023年10月,国内累计公开的大模(mó)型数量达(dá)到238个(gè),其中(zhōng),医疗大(dà)模型近50个,涉及患者问诊、医生助手(shǒu)、药物研(yán)发、健康科普等(děng)多个领域(yù)。据邳靖陶观察,许多医疗(liáo)大模型的开发从“全科”出发(fā),试图(tú)直接构建(jiàn)一个涵盖所有专(zhuān)科的大型(xíng)全科模型,供用户咨询各种疾病。

  但在参与(yǔ)构(gòu)建(jiàn)脑血管病专病大(dà)模型后,武剑教授团队对这一(yī)模式表(biǎo)示怀疑。他们发(fā)现,把一种疾病的临床(chuáng)指南梳理(lǐ)清楚颇具难度,打(dǎ)造对应的思维链也耗时耗力,短(duǎn)期内很难(nán)用同样的方法(fǎ)训练出全科模型。换(huàn)言之,目前的(de)全科大模型能够做(zuò)到医学科普,但很难在特定专(zhuān)科领(lǐng)域提供有效的临床指导。因此,武剑(jiàn)教授团队的(de)研 发思路是以专病为起点,再走向全科。

  “如果针对脑血管病的专病大(dà)模型走通了,我们可以把成功经验(yàn)复制到其(qí)他(tā)神(shén)经系统(tǒng)疾病上(shàng);如果神(shén)经系(xì)统疾病覆盖全面了,就成了专科大模(mó)型;神经科的经验(yàn)再复制到其他科(kē),就(jiù)会形成一个真正的全科(kē)医(yī)疗大模型。”邳靖陶表示,在(zài)武剑教授看来,国(guó)内发病人数(shù)越多、疾病负担越大的(de)疾病,其(qí)专病大(dà)模型的临床需 求和研发空间就会越大,例如(rú)我国发病率最高的四大慢(màn)病——高血(xuè)压、糖尿病、冠心病(bìng)、脑血(xuè)管病都有非常(cháng)广阔的大(dà)模型开发(fā)空间。

  而在脑血管病专病大模(mó)型的发布会上,武剑教授已经(jīng)通过招募令的形(xíng)式,呼吁全国神经系统疾病领域的专家,以及人工智能领域(yù)的专业人士携手把握创新技术(shù)的改革可能,改善临(lín)床诊疗现(xiàn)状。他(tā)表(biǎo)示,如果能打破(pò)学术壁(bì)垒(lěi),医疗大模型的重复性工作是完全可以避免的。

  “这不(bù)是(shì)我们一个人能做的事情(qíng)。”邳靖陶说。

责任编辑:何松琳

未经允许不得转载:橘子百科-橘子都知道 国内首个脑血管专病大模型亮相 对话参与医生:被AI“上了一课”

评论

5+2=