根据3月27日在线发表于《神经学(Neurology)》杂志的研究,大型语言模型(LLMs),如预训练生成式转换器GPTs,在定位急性中风病变方面展现出潜在能力。该研究由纽约州立大学唐斯特州立健康科学大学的Jung-Hyun Lee医生及其团队进行,他们评估了GPT-4模型在基于临床表现的病变定位方面的准确性。
研究中,GPT-4接收了急性中风已发表病例的病史和神经系统体格检查(H&P)信息,并运用零射链式思维和文本分类方法进行临床推理,最终得出关于“单个或多个病变”、“侧面”以及“脑区”的预测。研究团队将GPT-4的输出结果与基于成像的定位在46例病例中进行了三次独立对比试验。
研究结果显示,基于H&P原始文本的处理,GPT-4成功生成了准确的神经解剖定位和详细的临床推理。在性能分析中,针对侧面的特异性、敏感性、精确度和F1分数分别为0.87、0.74、0.75和0.74;而针对脑区的指标则分别为0.94、0.85、0.84和0.85。在脑区内部,除了小脑外,其他区域的分类标签均表现出较高的准确性,这一结果在三次试验中均保持一致。
错误产生的原因主要包括外在因素和内在因素。外在因素是指已发表病例中的信息不足;而内在因素则与模型的逻辑失败或知识库不足有关。
作者指出,未来在临床上,对神经疾病和神经解剖进行微调和培训的LLM,有望为那些受过有限神经定位和神经系统疾病诊断培训的医疗保健提供者提供有力支持。这一发现预示着大型语言模型在医疗领域的广阔应用前景。