网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

OpenAI Codex负责人:智能体开发应去繁就简,垂直整合与原语优化是关键

2026-02-23来源:快讯编辑:瑞雪

OpenAI Codex工程负责人Thibault Sottiaux近日做客Dev Interrupted播客,以40分钟深度对话拆解了团队构建自主编程智能体的核心方法论。他直言不讳地指出,当前许多团队在智能体开发中过度依赖复杂脚手架(scaffolding),这种做法看似扩展了功能,实则掩盖了模型能力的根本缺陷。"真正的智能体应该像独立站立的人,脚手架只是临时支撑,随着模型进化必须逐步拆除。"

这一观点与近期OpenAI的人才流动形成呼应。OpenClaw创始人Peter Steinberger在播客发布后宣布加入OpenAI,负责下一代个人智能体开发。作为曾公开宣称"Codex是我最大免费广告"的开发者,Steinberger用Codex重构了整个OpenClaw系统,使生产力提升一倍。尽管他同时认可Anthropic的Claude Opus是"最佳通用智能体",但最终选择OpenAI的逻辑与Sottiaux的论述高度契合:模型能力与垂直整合的生态优势远胜于表面工程堆砌。

Codex团队的开发哲学颠覆了传统产品思维。Sottiaux强调:"我们首先构建通用智能体,产品界面是后续适配的环节。"这种"智能体优先"的策略催生了意外应用场景——社区开发者将开源版本改造为电子表格编辑器、浏览器自动化工具等非编程领域产品。团队发现,软件工程师的真实瓶颈不在代码生成,而在于规划、沟通、代码审查等协作环节,这些才是模型能力跃升后暴露的新痛点。

垂直整合架构赋予Codex团队独特的决策权。研究团队与工程团队形成双向飞轮:工程实践中的问题直接反馈至研究方向,研究突破又重塑工程路线。Sottiaux透露,团队会在小、中、大型模型上同步测试系统表现,将扩展定律(scaling laws)从模型层面延伸至完整系统。这种耦合训练模式印证了No Free Lunch定理——为特定分布优化系统,能获得超越单独优化模型或框架的效能提升。

对于无法实现垂直整合的团队,Sottiaux给出明确判断:追求对所有基础模型的完全中立性,必然导致性能妥协。他预测主流玩家最终只会深度适配少数模型,"为数千个模型调整系统不现实"。当前许多团队将脚手架异化为"喷气背包",不断塞入工具和规则,反而制造了"能力悬崖"——当模型能力突然跃升时,系统偏见会阻碍新能力的表达。

Codex的开源策略包含三层战略考量:破除智能体神秘感、预判AI对开源生态的重构、借社区创造力探索新用法。团队通过与1000多个fork作者合作,持续将优质改进移植回主仓库。2023年从Type到Rust的语言迁移虽引发社区震动,但为未来数亿智能体并发运行奠定了性能基础,最终吸引了大批Rust开发者加入核心开发。

在解决上下文压缩难题时,团队再次体现"在正确层级解决问题"的原则。当智能体工作超出模型上下文窗口时,传统提示词和启发式方法效果不佳,团队选择在模型训练层面端到端优化。如今智能体可跨越20个上下文窗口持续工作,相关投诉几乎消失。这一案例成为垂直整合优势的典型例证。

面向2026年,Codex团队规划了三大方向:多智能体协作网络将使产出量提升1-2个数量级;模型速度优化将带来"智能与响应的甜蜜点";协作型人格开发将使智能体具备场景适配能力——在头脑风暴时保持开放,在代码审查时冷酷精准。去年Codex参与发现的React重量级漏洞,正是这种精准性的体现。

开发者角色正在经历根本性转变。Codex团队构建的代码审查模型已在OpenAI内部全面部署,成为质量把关的核心环节。Sottiaux观察到,团队面对面协作时间反而增加,因为每个成员都被加速后,需要在决策阶段更充分对齐。他特别强调"意图记录"的重要性,正在开发工具追踪组织级变更,使系统理解速度匹配代码生成速度的跃升。

对于职业发展,Sottiaux提出工程师将向"技术领导经理"(TLM)演进,兼具技术深度与产品视野。他特别提到团队中一位新毕业生的案例:这位没有传统编程包袱的成员,通过完全拥抱新工具,反而成为最受信任的核心开发者,其工作方式正在重塑整个团队的生产力模式。

在播客尾声,Sottiaux用"训练宝可梦"比喻智能体技能(Skills)开发。用户可以教模型执行特定任务,如日志分析、性能测试等,通过持续交互建立信任关系。"这不是一次性配置,而是像厨师磨制刀具一样,将智能体塑造成专属工作流的完美搭档。"他建议开发者超越代码自动化,将日常工作中最耗时但必要的环节交给智能体处理。

春节游客多投喂频,哈尔滨东北虎林园300余只东北虎开启轮流“轻断食”模式
2、“对冲”春节假期高频投喂压力,哈尔滨300多只东北虎启动轮流“轻断食”车辆依次经过多个常规投喂点,但往日常有老虎盘踞的大石头上空空如也,全程未见一只老虎现身等候投喂。 4万平方公里的东北虎豹国家公园四…

2026-02-23

四大AI模型竞技张会军作品总结赛道 阿里千问开源领域登顶全球榜首
云南永平县张会军自1994年起坚持业余创作,长期在《人民日报》《半月谈》《中国青年报》《学习强国》《光明网》等国家级主流媒体发表散文、时评与纪实类作品,内容聚焦乡土文化、教育民生与非遗传承,形成了具有广泛影…

2026-02-23

马斯克四大预言引热议:AI与机器人浪潮下,人类未来何去何从?
这不是马斯克第一次谈AI,但这次不一样,他把AI比作一场“超音速海啸”——不是说AI来了,而是说我们已经站在浪头上了,只是还没意识到脚下的水有多急。 马斯克的这四个预言,听上去令人兴奋,也令人不安,他画出了…

2026-02-23

职场会议新利器!科大讯飞iFLYBUDS Pro2、Pro3等无线降噪耳机深度对比
总结经过详细的对比,我们可以看到,科大讯飞的iFLYBUDSPro2和Pro3在降噪和录音转文字功能上表现突出,特别适合需要频繁进行会议记录的用户。索尼WF-1000XM4和苹果AirPods Pro 2在…

2026-02-22