网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

全球AI界热捧DeepSeek复现,低成本见证AI大模型新突破?

2025-01-28来源:黑科技研究所编辑:瑞雪

近日,一股复现DeepSeek的热潮在全球范围内迅速兴起,引发科技界的广泛关注。UC伯克利、香港科技大学以及HuggingFace等知名机构纷纷宣布成功复现了这一模型,标志着人工智能领域或许即将迈入一个新的发展阶段。

DeepSeek以其独特的强化学习路径而著称,无需监督微调,仅凭强化学习便能让基础语言模型展现出强大的自我验证和搜索能力。这一特性使得DeepSeek成为众多研究者争相复现的对象。据透露,复现DeepSeek的成本极低,仅需约30美元便能亲眼见证其“啊哈时刻”——模型在强化学习过程中突然展现出强大推理能力的瞬间。

UC伯克利的博士生潘家怡及其团队在CountDown游戏中复现了DeepSeek的R1-Zero版本,并取得了令人瞩目的成果。他们通过强化学习,让30亿参数的基础语言模型逐步进化出自我纠正和搜索的策略,成功解决了游戏中的复杂问题。这一成果不仅验证了DeepSeek的有效性,也进一步证明了强化学习在推动人工智能发展方面的巨大潜力。

与此同时,香港科技大学助理教授何俊贤的团队也在70亿参数的模型上复刻出了DeepSeek-R1-Zero和DeepSeek-R1的训练过程。他们仅使用了8000个样本,便让模型在复杂的数学推理上取得了强劲的表现。这一成果不仅超越了基础模型的性能,还与使用大量数据和复杂组件的其他模型相媲美。

全球最大的开源平台HuggingFace也宣布将复刻DeepSeek的R1所有pipeline。他们表示,复刻完成后,所有的训练数据、训练脚本等都将全部开源。这一举措无疑将进一步推动DeepSeek技术的普及和发展。

DeepSeek的成功复现,不仅让科技大厂们感受到了前所未有的压力,也让全球人工智能的中心转移问题再次成为热议话题。有观点认为,DeepSeek的出现标志着美国AI霸权的动摇,全球AI大模型的竞争将不再局限于算力战,而是更加注重算法和技术的创新。

DeepSeek的复现也引发了对人工智能未来发展的广泛讨论。有人认为,随着技术的不断进步和成本的降低,超强性能的模型将不再独属于算力巨头,而是属于每个人。这一观点无疑为人工智能的普及和发展带来了更多的可能性和希望。

马斯克xAI被曝融资150亿美元
据CNBC从知情人士处获悉,埃隆·马斯克掌舵的人工智能企业xAI于最新一轮融资中斩获约150亿美元资金,公司估值随之攀升至约2000亿美元。这一融资规模不仅远超市场此前预期,更成为近期科技领域备受瞩目的资本动作。

2025-11-14

李彦宏2025百度世界大会发声:AI内化驱动产业革新,成果加速出海
当前,百度搜索已成为全球AI化改造最激进的搜索引擎,用AI重构搜索结果页,转型成以富媒体为主的AI应用。大会上,李彦宏再次强调AI应用创新的价值。 “过去一年,我们看到模型能力逐步走出聊天机器人的范畴,数字…

2025-11-14

李彦宏:跨越临界点,AI“效果涌现”时代,内化能力引爆生产力革命
“当下非常重要的问题是,企业如何内化AI能力”——李彦宏介绍,这有三个代表性的应用方向: 李彦宏指出,百度是全球所有搜索引擎中AI化改造最激进的,用AI重构搜索结果页,而非简单插入AI摘要,“把搜索从一个以…

2025-11-14

李彦宏2025百度世界大会:AI内化驱动产业变革 开启智能生产力新纪元
“当下非常重要的问题是,企业如何内化AI能力”——李彦宏介绍,这有三个代表性的应用方向: 李彦宏指出,百度是全球所有搜索引擎中AI化改造最激进的,用AI重构搜索结果页,而非简单插入AI摘要,“把搜索从一个以…

2025-11-13

百度2025世界大会发布文心5.0大模型 参数量达2.4万亿 持续推升智能新高度
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-13

相芯科技携AI数字人成果亮相乌镇峰会,展现浙江科技新实力
该平台深度融合人工智能与建模、驱动、交互等核心技术,实现了数字人从生产到应用的全流程效率革新。作为浙江人工智能产业发展的先行力量,相芯科技未来将继续深化AI与数字人的融合创新,推动更高效、智能的数字人应用场景…

2025-11-13