网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

OpenAI今夏将推开源语言模型,目标:超越同类推理能力

2025-04-24来源:ITBEAR编辑:瑞雪

近期,OpenAI 宣布了一项备受瞩目的计划,即在今年夏季初推出自 GPT-2 之后的首个开源语言模型。这一消息引发了业界的广泛关注,关于该模型的细节也逐渐被披露。

据知情人士透露,OpenAI 研究副总裁 Aidan Clark 正亲自挂帅,领导这一开源模型的开发工作。尽管仍处于早期阶段,但公司对该模型寄予厚望,期望其在推理能力上能够超越现有的开源推理模型。值得注意的是,该模型将采用极为宽松的许可协议,几乎不对使用或商业化设置任何限制,这一举措显然是为了避免像 Llama 和谷歌的 Gemma 等开源模型因限制过多而引发的社区争议。

OpenAI 此举的背景是,近年来面临着来自竞争对手的巨大压力。中国的 DeepSeek 等公司采用开源策略,迅速取得了显著成功。这些竞争对手将模型提供给 AI 社区进行实验,甚至允许商业化使用,这一策略已被证明极为有效。例如,meta 在其 Llama 系列开源 AI 模型上投入巨大,并宣布该系列模型的下载量已超过 10 亿次。DeepSeek 也迅速积累了大量全球用户,并吸引了国内投资者的广泛关注。

据了解,OpenAI 的开源模型将采用“输入文本,输出文本”的模式,并可能允许开发者自由开启或关闭其“推理”功能。虽然开启推理功能可以提高模型的准确性,但也会增加延迟。如果此次发布反响良好,OpenAI 可能会继续推出更多模型,包括更小型的版本,以满足不同用户的需求。

然而,OpenAI 首席执行官 Sam Altman 此前曾在公开场合表示,他认为 OpenAI 在开源技术方面“站在了历史的错误一边”。他在一次 Reddit 问答中坦言:“我个人认为我们需要制定不同的开源策略。但并非 OpenAI 的每个人都认同这一观点,这也不是我们当前的首要任务。”尽管如此,OpenAI 仍然决定推出这一开源模型,并计划对其进行严格的“红队测试”和安全评估。

为了确保模型的安全性和可靠性,OpenAI 计划为该模型发布一份详细的技术报告,即模型卡。这份报告将展示 OpenAI 内部和外部的基准测试及安全测试结果,以便用户了解模型的性能和潜在风险。Altman 在上个月的一篇帖子中表示:“在发布之前,我们将根据我们的准备框架评估这一模型,就像对待其他任何模型一样。鉴于我们知道该模型在发布后可能会被修改,我们还将进行额外的工作。”

然而,OpenAI 在模型安全测试方面的做法也引发了一些 AI 伦理学家的批评。有批评指出,OpenAI 在对近期模型进行安全测试时显得过于匆忙,且未公布其他模型的模型卡。Altman 还被指控在 2023 年 11 月短暂被解职之前,误导了 OpenAI 高管关于模型安全审查的情况。这些争议无疑给 OpenAI 的开源计划增添了一些不确定性。

安谋科技发布“周易”X3 NPU IP,AIGC大模型能力跃升开启端侧AI新篇
智东西11月14日消息,昨日,安谋科技正式发布了专为端侧大模型而生的最新一代NPUIP——“周易”X3,其能够与Arm架构CPU、GPU协同,组成基于Arm生态的异构算力解决方案。 新的“周易”X3 NP…

2025-11-15

百度李彦宏2025世界大会发声:AI内化驱动,开启生产力革命新篇章
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14