李开复领衔，零一万物发布号称世界最强的Yi大模型-网界

【网界科技】11月6日消息，AI创业公司零一万物，由创新工场董事长兼CEO李开复领导，日前宣布正式发布其首款研发的开源人工智能大模型系列——Yi。

Yi系列的首个公开版本包括两款模型：Yi-6B和Yi-34B，它们的数据参数量分别为60亿和340亿，而且均对开源提供支持。

李开复表示：“零一万物立志成为全球领先的AI公司，从招聘第一位员工、编写第一行代码，到设计第一个模型，我们一直怀揣着成为世界第一的愿景和决心。”

他继续说道：“我们已经组建了一支具备挑战OpenAI、Google等一线巨头的潜力的团队，并在近半年的时间里付出不懈努力，最终取得了令人瞩目的成就。特别是Yi-34B，堪称一鸣惊人。”

从性能来看，Yi系列大模型确实实现了一次后发制人的突破。

在Hugging Face英文测试公开单Pretrained预训练开源模型排名中，Yi-34B以70.72的分数位列全球第一，超过了LLaMA-70B和Falcon-180B，尽管其参数量仅为后两者的一半和五分之一。

就中文语言处理能力而言，Yi-34B在C-eval中文能力排行榜上超越了所有开源模型，而同样开源的Yi-6B也在同规模的所有开源模型中脱颖而出。

此外，在CMMLU、E-eval和高考三个主要中文指标上，Yi系列明显领先于GPT-4;而在BooIQ和OBQA两个问答指标上，Yi系列的表现与GPT-4相媲美。

然而，在发布中，零一万物也坦言，Yi系列模型在GSM8k和MBPP的数学与代码测评中表现尚不及GPT模型，但他们计划在后续推出专门用于处理数学和代码的模型。

此外，Yi-34B还刷新了大模型的上下文窗口长度，达到了200K，可以处理约40万汉字的超长文本输入，而GPT-4仅支持32K、约2.5万汉字的文本输入。

李开复还透露，随着Yi-34B预训练的完成，零一万物已经着手启动下一个千亿参数模型的训练。这标志着零一万物在人工智能领域的不断进步和创新。