网界
网络资讯 产业经济 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

Meta四路并进,深研DeepSeek欲升级Llama大模型

2025-01-27来源:ITBEAR编辑:瑞雪

近期,据Information网站报道,meta公司,即Facebook的母公司,已成立四个专项研究团队,深入探索国产大模型DeepSeek的核心机制。此举旨在通过分析DeepSeek的工作原理,来优化meta自家的大模型Llama。

值得注意的是,就在不久前,DeepSeek-R1推理大模型正式面世。据官方披露,DeepSeek-R1在后训练阶段大规模运用了强化学习技术,即便在标注数据极为有限的情况下,也显著提升了模型的推理能力。在数学、代码编写以及自然语言推理等多项任务上,DeepSeek-R1的性能已可媲美OpenAI的GPT-1正式版。

更令人瞩目的是,Deepseek应用在发布后迅速走红,不仅在中国地区的苹果应用商店免费下载排行榜上夺得榜首,更是在美国地区的应用商店免费下载榜上超越了ChatGPT,展现出强大的市场吸引力和用户基础。