人工智能的进步尽管令人振奋，但人类监督仍然至关重要

科技

 0  136

积分：13

研究表明，目前的大型语言模型（LLMs）在医学编码方面表现不佳，强调了在考虑临床实施之前需要对这些技术进行细化和验证的必要性。研究人员从Mount Sinai Health System的12个月常规护理中提取了超过27,000个唯一的诊断和操作代码，并使用OpenAI、Google和Meta等模型输出最精确的医学代码。结果显示，所有研究的大型语言模型都显示出有限的准确性，在重建原始医学代码方面表现不佳。尽管GPT-4表现最佳，但仍然存在着无法接受的错误数量。研究人员认为，尽管人工智能具有巨大潜力，但必须谨慎对待并不断发展，以确保其在医疗保健领域的可靠性和有效性。同时，研究团队计划开发定制的LLM工具，以改善医疗保健运营的质量和效率。

研究标题为“生成式大型语言模型是糟糕的医学编码器：医学代码查询的基准分析”。研究得到了AGA Research Foundation的2023 AGA-Amgen Fellowship to-Faculty Transition Award AGA2023-32-06和NIH UL1TR004419奖项的支持。

研究人员强调，该研究是在没有使用任何受保护的健康信息（PHI）的情况下进行的。

0 收藏分享举报

近一月发帖榜 - TOP 12

sweens 8990帖子

Humi_123 62帖子

mayiko 1帖子

版块列表

最近热帖: 新能源车下乡活动：99款入选车型优惠直达消费者  99; 稳步推进金融高水平制度型开放  99; 广东省新质生产力发展的“新”特色产品及技术  98; 青岛多举措提升入境游服务水平，发展邮轮旅游经济  98; 国家统计局发布报告称：近期房地产市场活跃度有所提升  98; 第13届柏林双年展延期至2025年  971; 一种新方法使得假币更容易被检测出来  97; 5月中国经济数据解读  97; 山东低空经济规模突破300亿：上市公司竞逐新赛道  97

精选帖子