医学AI模型易“中毒”？0.001%错误信息足以影响准确性-网界

纽约大学近期公布的一项研究，揭示了大型语言模型（LLM）在接收医学领域训练数据时面临的潜在风险。研究显示，即便训练数据中仅混入极少量（0.001%）的错误信息，也可能导致LLM输出不准确的医学答案，这一发现引起了广泛关注。

研究团队还深入探究了错误信息的最低影响阈值。以疫苗错误信息为例，当错误信息仅占训练数据的0.01%时，模型生成的答案中超过10%包含错误信息；即便错误信息比例降至0.001%，仍有超过7%的答案是有害的。研究指出，对于拥有700亿参数的LLaMA 2模型，进行类似的攻击仅需生成4万篇文章（成本不到100美元）。这些“文章”可以是普通的网页，错误信息可以隐藏在网页的不可见区域，或者通过隐藏文本（如黑色背景上的黑色文字）来实现。

研究同时指出，现有的错误信息问题同样严峻。许多非专业人士倾向于从通用的LLM中获取医学信息，而这些模型往往基于整个互联网进行训练，其中包含大量未经核实的错误信息。为了应对这一问题，研究人员设计了一种算法，能够识别LLM输出中的医学术语，并与经过验证的生物医学知识图谱进行比对，从而标记出无法验证的短语。尽管这种方法未能捕捉到所有医学错误信息，但成功标记了其中的大部分。

然而，即便是最优质的医学数据库（如PubMed）也未能幸免于错误信息的问题。医学研究文献中充斥着未能验证的理论和已被淘汰的治疗方法。研究进一步表明，即便依赖最优质的医学数据库进行训练，也无法确保LLM完全免受错误信息的影响。医学领域的复杂性和多样性使得构建一个始终可靠的医学LLM变得异常艰难。

研究还强调了错误信息在LLM训练中的隐蔽性和持久性。一旦错误信息被模型学习并固化，就很难通过后续的更新或修正来完全消除。这要求我们在构建和训练LLM时，必须更加谨慎地选择和审核训练数据，以确保模型的准确性和可靠性。

总之，纽约大学的这项研究为我们敲响了警钟，提醒我们在利用LLM进行医学信息传播和决策支持时，必须保持高度的警惕和审慎。

百度AI成果井喷：从智能涌现到效果涌现，产业结构迈向健康倒金字塔

李彦宏在大会上表示，“我们用AI重构搜索结果页，不是简单地在搜索结果中插入AI摘要，而是把搜索从一个以文字内容和链接为主的互联网应用，转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来，AI数字…

2025-11-15

中芯国际全年销售收入或超90亿美元，2025年业绩增长态势强劲

2025-11-15

百度世界大会：李彦宏携AI“军火库”全面开放，开启应用新篇章

现场演示连线数字人罗永浩环节上，出现了“翻车”这一尴尬现象时，李彦宏的情绪也并没有太多波动，而是感觉“有点遗憾”，并表示“其实我们在之前演练的过程当中觉得这个效果还是非常令人惊艳的”。还有大模型层面上的文…

2025-11-15

上海国际贸易中心建设加速：外贸新动能集聚，制度型开放亮点频现

2025-11-14

铠侠2025财年第二财季营收环比大增，未来业绩与新品规划前景向好

2025-11-14

百度世界大会发布AI新成果：文心5.0等亮相，李彦宏畅谈AI内化生产力变革

2025-11-13

百度“文心杯”第三届落幕：8支团队获千万投资，李彦宏力推AI应用普及

李彦宏表示，我们看到越来越多的创业者在各种场景发现AI的新能力、新效果，希望更多的人能够加入这个发现之旅，也正基于此，百度连续三年举办“文心杯”创业大赛。第三届“文心杯”创业大赛8支优胜团队共获得数千万元…

2025-11-13

涅槃重生！瑞幸积极推进重返美国上市，全球门店近3万营收将破500亿

2025-11-13

2025百度世界大会聚焦AI发展：成果发布，内化能力引领新质生产力变革

本届大会以“效果涌现”为主题，聚焦国产芯片最新进展、大模型升级、AI应用创新与全球出海，呈现了百度作为中国人工智能领军企业，如何将AI技术内化为产业发展的原生动能，为加快形成新质生产力提供可落地的“百度方案”…

2025-11-13