网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

中国AI新贵DeepSeek,能否撼动OpenAI的霸主地位?

2025-01-26来源:北京日报编辑:瑞雪

在AI领域的全球版图上,一家名为深度求索(DeepSeek)的中国企业正以其卓越的创造力引发广泛关注。近日,这家总部位于杭州的公司凭借其最新发布的推理模型R1,在欧美AI界掀起了一场不小的波澜。

美国知名财经媒体CNBC在报道中指出,DeepSeek的AI模型对美国的AI主导地位构成了威胁。与此同时,华尔街顶级风投机构A16Z的创始人马克·安德森也在社交媒体上高度赞扬了DeepSeek R1,称其为最令人惊叹的突破之一,并且是开源的,是对世界的馈赠。英伟达公司的资深科学家Jim Fan同样对DeepSeek给予了高度评价。

据媒体报道,社交媒体巨头meta的员工在匿名职场社区上透露,DeepSeek的近期动态让meta的生成式AI团队感到恐慌,工程师们正急于分析DeepSeek,希望从中复制任何有价值的技术。此前,OpenAI前政策主管、Anthropic联合创始人杰克·克拉克也曾表示,DeepSeek拥有一支才华横溢的团队,并认为中国制造的大模型将成为一股不可忽视的力量。国外多家科技博客也纷纷对DeepSeek进行了详尽的报道。

那么,这家让欧美科技界和创投圈大佬及媒体纷纷称赞的中国大模型公司,究竟有何过人之处呢?

DeepSeek近日发布的推理模型R1,在性能上已逼近OpenAI的o1正式版,但推理成本却仅为后者的几十分之一。纽约时报指出,DeepSeek以极低的成本(600万美元)和少量的芯片(2000块)实现了与OpenAI等巨头相媲美的性能,打破了“只有科技巨头才能研发尖端AI”的行业惯例。

DeepSeek的这一创新不仅降低了研发成本,更提升了用户体验。R1功能强大且完全免费,同时还向开发者开源了代码。许多网友纷纷表示,DeepSeek的模型在写代码方面表现甚至优于GPT,且使用成本更低。记者亲身体验发现,只需登录DeepSeek的官网或手机APP,即可通过“深度思考”功能感受R1的强大能力。

在与DeepSeek的对话中,记者提出了关于DeepSeek R1模型发布与英伟达股价下跌之间关系的问题。DeepSeek从多个维度进行了逻辑严密的分析,并围绕技术趋势、市场情绪与预期管理、行业生态等方面给出了精要的阐述和结论。在使用过程中,R1不仅能够用动画解释复杂的量子力学,还能轻松应对脑筋急转弯,以及用缜密的逻辑回答各种难题。

据了解,DeepSeek R1并未采用业内普遍使用的监督微调(SFT)训练范式,而是通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等。这种方法不仅提高了训练效率,还显著降低了对昂贵计算资源的依赖。与OpenAI的o1相比,DeepSeek模型的百万token输入成本从15美元降至0.55美元,输出成本也从60美元降低到2美元。

DeepSeek的创新成果甚至被一些股民视为芯片巨头英伟达股价下跌的原因之一。有人提出,DeepSeek正是在美国对华进行芯片出口限制的背景下激发出的创新力量。业内人士认为,DeepSeek的出现标志着中国AI产业正从“跟随创新”向“范式创新”转变,全球AI竞争也进入了技术多极化的新时代。

阿里巴巴“通义”App升级更名“千问”,AI战略转向消费级市场新布局
根据官方消息,“千问”定位为阿里旗下最重要的大模型应用入口,其核心能力基于阿里自研的大模型体系Qwen(千问)。 分析人士指出,阿里此前在To B市场和模型研发侧拥有技术基础,但在消费端应用分发层面还未形成…

2025-11-15

Dexmal原力灵机获近10亿融资 阿里蔚来资本助力具身智能研发落地
IT之家 11 月 14 日消息,具身智能公司 Dexmal 原力灵机今日宣布完成数亿元 A+ 轮融资,阿里巴巴为独家投资方。IT之家注意到,该公司 A 轮融资由蔚来资本领投,洪泰基金、联想创投、锡创投和正…

2025-11-14

百度世界大会发布文心大模型5.0 参数量2.4万亿能力达全球领先
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-13