人工智能在准确评估眼部问题方面击败医生

科技
0 163

一项由剑桥大学领导的研究发现,GPT-4,一种“大型语言模型”,在测试中表现出与专科眼科医生接近的临床知识和推理能力。研究将GPT-4与不同职业阶段的医生进行了比较,包括初级医生、实习医生和专家眼科医生。结果显示,GPT-4在测试中的表现显著优于初级医生,与实习医生和专家眼科医生的得分相似,尽管最优秀的医生得分更高。

研究人员表示,大型语言模型不太可能取代医疗专业人士,但有潜力作为临床工作流程的一部分来改善医疗保健。他们认为,像GPT-4这样的最新大型语言模型在受控环境下,如对患者进行分诊或在专科医疗保健专业人员资源有限的情况下,提供眼科咨询、诊断和治疗建议可能非常有用。

研究的主要作者阿伦·西鲁纳瓦卡拉苏博士指出:“我们可以在对眼部问题进行分诊时实际使用AI来决定哪些病例需要立即由专家处理,哪些可以由全科医生处理,哪些不需要治疗。” 研究还测试了GPT-3.5、PaLM2和LLaMA等其他大型语言模型,并发现GPT-4的回答比它们更准确。

研究结果发表在《PLOS数字健康》期刊上。研究人员强调,尽管考虑到未来AI的使用,医生仍将继续负责患者护理。然而,他们认为最重要的是赋予患者决定是否需要计算机系统参与护理的权力。此外,研究还指出,大型语言模型领域正在迅速发展,更先进的模型已经发布,可能更接近于专家眼科医生的水平。

0 收藏 分享 举报
  • «
  • »