网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

苹果杜克联手突破!AI交错推理让Qwen2.5模型响应飙升80%

2025-05-30来源:ITBEAR编辑:瑞雪

近期,苹果公司与杜克大学的一项合作研究引起了科技界的广泛关注。这项研究提出了一种名为交错推理的全新强化学习方法,旨在增强大语言模型的推理能力。

在以往,大型语言模型在处理复杂的多步骤问题时,通常采用一种线性的推理方式,即先完成整个推理过程,再给出答案。然而,这种方式存在明显缺陷:一方面,它导致了较长的响应时间,无法满足即时交互的需求;另一方面,一旦推理过程中的某个环节出错,最终答案的准确性也会大打折扣。

与人类的对话习惯不同,语言模型往往不会在推理过程中分享任何中间想法,而是等待全部推理完成后再一次性输出结果。这种“闭门造车”的方式,无疑降低了模型的效率。

为了克服这一难题,苹果与杜克大学的研究人员共同研发了交错推理技术。这一技术允许模型在推理过程中交替进行内部计算和输出中间答案,从而极大地提升了速度和实用性。

交错推理技术基于强化学习框架,采用了一种特殊的训练模板,其中包含了特定的标签,以确保模型在关键推理节点上能够输出中间结果。研究团队还设计了一套基于规则的奖励机制,包括格式正确性、最终答案准确率和条件性中间准确率,以引导模型注重整体推理的准确性。

在实际测试中,交错推理技术在Qwen2.5模型(包括1.5B和7B参数版本)上取得了显著成效。与传统方法相比,响应速度提升了超过80%,准确率也提高了高达19.3%。更令人瞩目的是,该方法仅在问答和逻辑数据集上进行了训练,却能够在MATH、GPQA、MMLU等更具挑战性的基准测试中展现出强大的泛化能力。

研究团队还尝试了多种奖励策略,如全或无奖励、部分积分奖励和时间折扣奖励等。实验结果表明,条件性和时间折扣奖励策略的效果最佳,显著优于传统奖励方法。

iPhone 18系列或迎新突破:测试屏下3D技术,灵动岛尺寸有望再缩小
其实屏下摄像头这个技术,最早可能要追溯到2019年,那个手机厂商都在疯狂“全面屏”时代,但是屏下摄像头技术尚不成熟,弊端也很明显,一是挖孔位置没办法与屏幕整体融合在一起,挖孔位置比较明显;二是屏下摄像头的成…

2025-12-09

马斯克下月将开源X平台全部代码,技术透明化是共享还是新博弈?
此前他已经开源了Grok大模型,这次X开源更是剑指技术透明化,背后还藏着X平台的AI变革野心——新算法由Grok驱动,信息流质量大幅提升,开源后有望吸引全球开发者共建生态。 但疑问也来了:毫无保留开源会不会泄…

2025-12-09

华为MateBook Pro与Fold鸿蒙电脑迎来HarmonyOS 6正式版,亮点功能大揭秘
MateBook Fold非凡大师折叠屏电脑的虚拟键盘新增壁纸联动功能,更换壁纸时,键盘将智能匹配主题色调或亮点颜色,自动应用最佳配色,让虚拟键盘成为桌面的视觉延伸(设置路径:虚拟键盘> 设置 > 主题…

2025-12-09

双12小米“降价潮”来袭,红米K90 Pro Max降价后,性价比再升级
为了避免自己购买的手机快速降价,很多人会购买高性价比机型,但就阿维看来这种思路完全错了,虽然按理来说这类高性价比手机利润更低,价格应该会更稳定,但这几年手机行业的情况已经不一样了,不走高性价比路线的机型反而不…

2025-12-09