OpenAI今夏将推开源语言模型，目标：超越同类推理能力-网界

近期，OpenAI 宣布了一项备受瞩目的计划，即在今年夏季初推出自 GPT-2 之后的首个开源语言模型。这一消息引发了业界的广泛关注，关于该模型的细节也逐渐被披露。

据知情人士透露，OpenAI 研究副总裁 Aidan Clark 正亲自挂帅，领导这一开源模型的开发工作。尽管仍处于早期阶段，但公司对该模型寄予厚望，期望其在推理能力上能够超越现有的开源推理模型。值得注意的是，该模型将采用极为宽松的许可协议，几乎不对使用或商业化设置任何限制，这一举措显然是为了避免像 Llama 和谷歌的 Gemma 等开源模型因限制过多而引发的社区争议。

OpenAI 此举的背景是，近年来面临着来自竞争对手的巨大压力。中国的 DeepSeek 等公司采用开源策略，迅速取得了显著成功。这些竞争对手将模型提供给 AI 社区进行实验，甚至允许商业化使用，这一策略已被证明极为有效。例如，meta 在其 Llama 系列开源 AI 模型上投入巨大，并宣布该系列模型的下载量已超过 10 亿次。DeepSeek 也迅速积累了大量全球用户，并吸引了国内投资者的广泛关注。

据了解，OpenAI 的开源模型将采用“输入文本，输出文本”的模式，并可能允许开发者自由开启或关闭其“推理”功能。虽然开启推理功能可以提高模型的准确性，但也会增加延迟。如果此次发布反响良好，OpenAI 可能会继续推出更多模型，包括更小型的版本，以满足不同用户的需求。

然而，OpenAI 首席执行官 Sam Altman 此前曾在公开场合表示，他认为 OpenAI 在开源技术方面“站在了历史的错误一边”。他在一次 Reddit 问答中坦言：“我个人认为我们需要制定不同的开源策略。但并非 OpenAI 的每个人都认同这一观点，这也不是我们当前的首要任务。”尽管如此，OpenAI 仍然决定推出这一开源模型，并计划对其进行严格的“红队测试”和安全评估。

为了确保模型的安全性和可靠性，OpenAI 计划为该模型发布一份详细的技术报告，即模型卡。这份报告将展示 OpenAI 内部和外部的基准测试及安全测试结果，以便用户了解模型的性能和潜在风险。Altman 在上个月的一篇帖子中表示：“在发布之前，我们将根据我们的准备框架评估这一模型，就像对待其他任何模型一样。鉴于我们知道该模型在发布后可能会被修改，我们还将进行额外的工作。”

然而，OpenAI 在模型安全测试方面的做法也引发了一些 AI 伦理学家的批评。有批评指出，OpenAI 在对近期模型进行安全测试时显得过于匆忙，且未公布其他模型的模型卡。Altman 还被指控在 2023 年 11 月短暂被解职之前，误导了 OpenAI 高管关于模型安全审查的情况。这些争议无疑给 OpenAI 的开源计划增添了一些不确定性。