【网界科技】3月6日消息,meta宣布推出新型大型语言模型"LLaMA",并声称其性能优于OpenAI的GPT-3模型。根据meta官网发布的论文,LLaMA目前包含70亿、130亿、330亿和650亿这4种参数规模的模型,其中最小规模的LLaMA7B也经过了超1万亿个tokens的训练。在大多数基准测试中,参数仅为十分之一的LLaMA-13B的性能优于OpenAI推出的GPT3(175B)。LLaMA-65B也可与业内领先的Chinchilla-70B和PaLM-540B竞争。
近日,国外匿名论坛4chan泄露了LLaMA成品库,并且种子文件被合并到了meta Research的GitHub上,目前该项目在GitHub已收获7k+个星。有网友猜测:这可能是meta故意泄露的,以对抗OpenAI。
据网界科技了解,一些客户认为LLaMA是更好的模型,可以击中他们以每年25万美元的价格出售访问权的商业计划的核心。访问他们的服务一个月可以购买一台能够运行这种泄露模型的机器。然而,meta方面尚未对此事做出回应。
这次推出LLaMA模型,使得meta公司成为了人工智能领域的市场竞争者之一,与谷歌、微软等公司展开了竞争。而这次泄露事件,虽然存在阴谋论的说法,但是对于meta来说,它也可能成为了宣传LLaMA模型的契机,同时也可能会带来更多的用户关注和使用。