网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

Meta的LLaMA模型挑战业内领先模型 性能超越Chinchilla-70B和PaLM-540B

2023-03-06来源:网界科技编辑:星辉

【网界科技】3月6日消息,meta宣布推出新型大型语言模型"LLaMA",并声称其性能优于OpenAI的GPT-3模型。根据meta官网发布的论文,LLaMA目前包含70亿、130亿、330亿和650亿这4种参数规模的模型,其中最小规模的LLaMA7B也经过了超1万亿个tokens的训练。在大多数基准测试中,参数仅为十分之一的LLaMA-13B的性能优于OpenAI推出的GPT3(175B)。LLaMA-65B也可与业内领先的Chinchilla-70B和PaLM-540B竞争。

近日,国外匿名论坛4chan泄露了LLaMA成品库,并且种子文件被合并到了meta Research的GitHub上,目前该项目在GitHub已收获7k+个星。有网友猜测:这可能是meta故意泄露的,以对抗OpenAI。

据网界科技了解,一些客户认为LLaMA是更好的模型,可以击中他们以每年25万美元的价格出售访问权的商业计划的核心。访问他们的服务一个月可以购买一台能够运行这种泄露模型的机器。然而,meta方面尚未对此事做出回应。

这次推出LLaMA模型,使得meta公司成为了人工智能领域的市场竞争者之一,与谷歌、微软等公司展开了竞争。而这次泄露事件,虽然存在阴谋论的说法,但是对于meta来说,它也可能成为了宣传LLaMA模型的契机,同时也可能会带来更多的用户关注和使用。


阿里巴巴“通义”App升级更名“千问”,AI战略转向消费级市场新布局
根据官方消息,“千问”定位为阿里旗下最重要的大模型应用入口,其核心能力基于阿里自研的大模型体系Qwen(千问)。 分析人士指出,阿里此前在To B市场和模型研发侧拥有技术基础,但在消费端应用分发层面还未形成…

2025-11-15

Dexmal原力灵机获近10亿融资 阿里蔚来资本助力具身智能研发落地
IT之家 11 月 14 日消息,具身智能公司 Dexmal 原力灵机今日宣布完成数亿元 A+ 轮融资,阿里巴巴为独家投资方。IT之家注意到,该公司 A 轮融资由蔚来资本领投,洪泰基金、联想创投、锡创投和正…

2025-11-14

百度世界大会发布文心大模型5.0 参数量2.4万亿能力达全球领先
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-13