网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

阶跃星辰Step-Audio-R1.1登顶权威榜单 准确率96.4%领跑语音推理赛道

2026-01-16来源:互联网编辑:瑞雪

在人工智能领域,原生语音推理模型的竞争愈发激烈。近日,全球知名的大模型评测榜单Artificial Analysis Speech Reasoning迎来更新,阶跃星辰推出的原生语音推理模型Step-Audio-R1.1凭借卓越表现登顶榜首,引发行业广泛关注。

Artificial Analysis Speech Reasoning榜单作为评估“原生语音模型”的权威第三方基准,重点考察模型直接处理音频并完成复杂逻辑推理的能力,准确率、首包延迟等关键指标是衡量模型性能的重要维度。在这样严格的评判标准下,Step-Audio-R1.1脱颖而出,以96.4%的准确率超越了Grok、Gemini、GPT-Realtime等主流一线模型,刷新了该榜单的历史最好成绩。

语音模型若要实现更高阶的智能交互,强大的推理能力必不可少。如同大语言模型需要深度理解语义并给出合理回应一样,语音模型也需具备类似能力,才能让用户感受到自然流畅的交流体验。Step-Audio-R1.1在性能与速度的综合权衡上表现突出,全面碾压同类语音模型。它由阶跃星辰发布,其前代Step-Audio-R1是全球首个开源的原生语音推理模型,能够在不增加额外时延的情况下,端到端地理解语音内容,实现“像人类一样听到对话即可思考”的效果。

Step-Audio-R1.1作为最新升级版本,在继承前代优势的基础上,进一步提升了实时对话和复杂语音推理能力。其核心能力涵盖深度语音推理、实时响应能力以及音频领域的可扩展CoT。这些能力使得该模型在处理语音任务时更加高效、精准,能够满足多样化的应用场景需求。

目前,Step-Audio-R1.1的权重已上传至HuggingFace,方便开发者进行研究和应用。同时,开放的chat模式已搭载R1.1核心,支持边想边说的流式推理,为用户带来更加流畅的交互体验。完整的实时语音API预计将于2月上线,届时将进一步拓展该模型的应用范围,推动原生语音推理技术在更多领域的落地。

“物理AI”浪潮来袭:从概念萌芽到多领域落地应用的新征程
“物理AI”也是自动驾驶汽车的“智能老司机”:它能实时处理摄像头、雷达等传感器捕捉的周边路况信息,凭借融合了视觉识别、逻辑推理与动作决策的智能模型,无论是在开阔高速平稳巡航,还是应对人车混行、突发变道等复杂…

2026-01-16

OpenAI注资Merge Labs:奥尔特曼以人机融合探索人类与AI共存新路径
Merge Labs 将自身定义为致力于“连接生物智能与人工智能”的研究实验室,旨在通过规模化连接神经元,来恢复人类丧失的能力并扩展想象力。在愿景方面,早在 2017 年,奥尔特曼就曾撰文预测人类将在 2…

2026-01-16