【网界科技】11月6日消息,AI创业公司零一万物,由创新工场董事长兼CEO李开复领导,日前宣布正式发布其首款研发的开源人工智能大模型系列——Yi。
Yi系列的首个公开版本包括两款模型:Yi-6B和Yi-34B,它们的数据参数量分别为60亿和340亿,而且均对开源提供支持。
李开复表示:“零一万物立志成为全球领先的AI公司,从招聘第一位员工、编写第一行代码,到设计第一个模型,我们一直怀揣着成为世界第一的愿景和决心。”
他继续说道:“我们已经组建了一支具备挑战OpenAI、Google等一线巨头的潜力的团队,并在近半年的时间里付出不懈努力,最终取得了令人瞩目的成就。特别是Yi-34B,堪称一鸣惊人。”
从性能来看,Yi系列大模型确实实现了一次后发制人的突破。
在Hugging Face英文测试公开单Pretrained预训练开源模型排名中,Yi-34B以70.72的分数位列全球第一,超过了LLaMA-70B和Falcon-180B,尽管其参数量仅为后两者的一半和五分之一。
就中文语言处理能力而言,Yi-34B在C-eval中文能力排行榜上超越了所有开源模型,而同样开源的Yi-6B也在同规模的所有开源模型中脱颖而出。
此外,在CMMLU、E-eval和高考三个主要中文指标上,Yi系列明显领先于GPT-4;而在BooIQ和OBQA两个问答指标上,Yi系列的表现与GPT-4相媲美。
然而,在发布中,零一万物也坦言,Yi系列模型在GSM8k和MBPP的数学与代码测评中表现尚不及GPT模型,但他们计划在后续推出专门用于处理数学和代码的模型。
此外,Yi-34B还刷新了大模型的上下文窗口长度,达到了200K,可以处理约40万汉字的超长文本输入,而GPT-4仅支持32K、约2.5万汉字的文本输入。
李开复还透露,随着Yi-34B预训练的完成,零一万物已经着手启动下一个千亿参数模型的训练。这标志着零一万物在人工智能领域的不断进步和创新。