网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

苹果AI研究揭秘:简单算术竟难倒20多个顶尖模型,AI真能超越人类智慧?

2024-11-02来源:ITBEAR编辑:瑞雪

近日,苹果公司内部研究团队揭露了一个令人惊讶的发现:即便是目前最尖端的AI模型,在处理包含干扰信息的简单算术问题时,表现竟不如小学生。这一结果引发了关于人工智能真实能力的新一轮讨论。

据《洛杉矶时报》报道,苹果团队采用了一道涉及猕猴桃采摘数量的算术题进行测试。题目描述了一个简单的场景:Oliver在三天内采摘了不同数量的猕猴桃,其中还包括了一些额外的、与总数计算无关的信息。然而,就是这样一个看似简单的问题,却让20多个高级AI模型纷纷“栽跟头”。

正确答案应为190个猕猴桃,但多数AI模型给出的答案却是185个。研究发现,这些模型在处理问题时,难以忽略那些看似相关、实则无关的干扰信息,如“其中有5个猕猴桃的块头要比平均值要小”。这一细节虽不影响总数的计算,却成功迷惑了众多AI。

苹果团队进一步指出,这一问题的根源在于,当前的AI模型主要依赖于训练数据中的语言模式进行推理,而非真正理解了数学概念本身。这意味着,在面对稍微复杂或包含非典型信息的问题时,AI的“智能”可能就会变得不再可靠。

值得注意的是,苹果的研究并非旨在全盘否定AI的价值。相反,他们希望通过这一发现,提醒人们在热情拥抱AI技术的同时,也应保持理性的认知和审慎的态度。简单的数据扩展或计算能力提升,并不能从根本上解决AI在逻辑推理方面的局限性。

此次研究不仅揭示了AI模型在处理复杂问题时的潜在弱点,也为未来AI技术的发展提供了新的思考方向。随着技术的不断进步,我们期待看到更加智能、更加可靠的AI系统出现。

安谋科技发布“周易”X3 NPU IP,AIGC大模型能力跃升开启端侧AI新篇
智东西11月14日消息,昨日,安谋科技正式发布了专为端侧大模型而生的最新一代NPUIP——“周易”X3,其能够与Arm架构CPU、GPU协同,组成基于Arm生态的异构算力解决方案。 新的“周易”X3 NP…

2025-11-15

百度李彦宏2025世界大会发声:AI内化驱动,开启生产力革命新篇章
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14