网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

字节Seed团队开源推理大模型,Seed-OSS系列在7项基准测试中夺冠

2025-08-21来源:智东西编辑:瑞雪

字节跳动旗下的Seed团队近日宣布了一项重大开源举措,正式推出了Seed-OSS系列模型。这一系列模型专为处理长上下文、推理任务、Agent行为及通用场景设计,其上下文窗口扩展至前所未有的512k,这一数字是业界常规上下文窗口(128k)的四倍,甚至超越了GPT-5的两倍,相当于能够一次性处理约1600页文本的内容。

Seed-OSS系列模型特别针对推理任务进行了优化,并赋予用户调节思维预算的灵活性,以满足不同应用场景的需求。此次开源包含了三个版本:基础模型Seed-OSS-36B-Base、无合成数据基础模型Seed-OSS-36B-Base-woSyn,以及经过指令微调的Seed-OSS-36B-Instruct。

在多个基准测试中,经过指令微调的Seed-OSS-36B-Instruct展现了出色的性能,在通用知识、Agent行为、编程及长上下文等领域取得了7项开源模型中的最佳表现(SOTA)。其整体能力超越了Qwen3-32B、Gemma3-27B及gpt-oss-20B等模型,与Qwen3-30B-A3B-Thinking-2507在多数领域不相伯仲。

Seed-OSS系列模型遵循宽松的Apache2.0开源协议,并计划在未来发布详细的技术报告。这些模型采用了12万亿个token的预训练数据,基于当前主流的因果语言模型架构,即预测下一个token的模型类型,且全部为稠密模型,未采用MoE等复杂架构。

在技术创新方面,Seed-OSS系列结合了多项关键技术,包括RoPE(旋转位置编码)、GQA注意力机制、RMSNorm归一化及SwiGLU激活函数等,这些组件的组合旨在提升训练稳定性和推理性能。尤为Seed-OSS的512k上下文窗口并非后续扩展,而是原生训练的结果。

模型还引入了思考预算功能,帮助开发者控制推理成本并优化使用体验。根据Seed团队的分享,对于简单任务,随着思维预算的增加,模型分数波动不大;而对于复杂任务,分数则会随着思维预算的增加而提升。在默认模式下,模型没有思考长度限制,但若指定思维预算,建议优先考虑512的整数倍值。

Seed-OSS系列模型一经发布,便获得了开发者社区的广泛认可。Hugging Face的工程师Tiezhen Wang评价称,这一系列模型非常适合进行消融研究,能够以较低成本探索不同组件对大模型性能的影响。社区成员也纷纷表示,如此规模的基础模型在开源界较为罕见,且长上下文能力对实际应用具有重要意义。

近期,字节跳动Seed团队频繁开源多款模型,除了Seed-OSS系列外,还包括多语言翻译模型Seed-X、智能体模型Tar系列及图像编辑模型Vincie等。这一系列举措表明,开源正逐渐成为模型发布的重要选择,甚至像OpenAI这样原本坚持闭源的厂商也开始逐步开源其模型。字节跳动此次将核心语言模型贡献给社区,无疑为开源研究提供了更多基础模型的选择。

百度AI成果井喷:从智能涌现到效果涌现,产业结构迈向健康倒金字塔
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-15

百度世界大会:李彦宏携AI“军火库”全面开放,开启应用新篇章
现场演示连线数字人罗永浩环节上,出现了“翻车”这一尴尬现象时,李彦宏的情绪也并没有太多波动,而是感觉“有点遗憾”,并表示“其实我们在之前演练的过程当中觉得这个效果还是非常令人惊艳的”。 还有大模型层面上的文…

2025-11-15

百度世界大会发布AI新成果:文心5.0等亮相,李彦宏畅谈AI内化生产力变革
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-13

百度“文心杯”第三届落幕:8支团队获千万投资,李彦宏力推AI应用普及
李彦宏表示,我们看到越来越多的创业者在各种场景发现AI的新能力、新效果,希望更多的人能够加入这个发现之旅,也正基于此,百度连续三年举办“文心杯”创业大赛。 第三届“文心杯”创业大赛8支优胜团队共获得数千万元…

2025-11-13

2025百度世界大会聚焦AI发展:成果发布,内化能力引领新质生产力变革
本届大会以“效果涌现”为主题,聚焦国产芯片最新进展、大模型升级、AI应用创新与全球出海,呈现了百度作为中国人工智能领军企业,如何将AI技术内化为产业发展的原生动能,为加快形成新质生产力提供可落地的“百度方案”…

2025-11-13