网界
网络资讯 产业经济 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

中国开源新势力:基础模型战场的浙江三剑客如何引领全球创新?

2025-04-08来源:ITBEAR编辑:瑞雪

在人工智能领域,中国的开源力量正迅速崛起,引领着全球基础模型的发展潮流。近日,DeepSeek联合清华大学发布了一项关于推理时Scaling的新研究论文,引发了外界对DeepSeek-R2即将发布的广泛猜测。这家创业公司,因其在开源模型领域的杰出贡献,被誉为“真正的Open AI”。其两大模型DeepSeek-V3和DeepSeek-R1在GitHub上的Star数量,短短两个月内便超越了OpenAI的明星项目Whisper。

DeepSeek之所以能在短时间内获得如此大的影响力,除了其模型本身的卓越表现和低成本外,更重要的是其开源的姿态。DeepSeek采用了最宽松的MIT开源协议,不仅详细公布了技术原理,还持续释放了从计算、通信、存储到系统架构等各个层面的优化工具。这种开放共享的精神,极大地推动了人工智能领域的创新与发展。

与此同时,国内另一开源巨头阿里云也取得了显著的成果。其文生视频模型万相2.1(Wan2.1)在发布仅6天后,就在Hugging Face及魔搭社区的总下载量超过了百万。截至2月底,整个通义千问(Qwen)系列模型的下载量已达到1.8亿,累计衍生模型总数达到9万个,超越了海外开源大模型鼻祖meta的Llama系列,成为全球第一大开源模型系列。阿里云还计划在本月发布上半年最重要的模型Qwen3。

除了DeepSeek和阿里云外,国内的大模型公司如阶跃星辰、MiniMax、智谱、百度等也纷纷发布了开源成果。在人工智能这一关键战场,中国正崛起为一支不可忽视的开源力量。这股开源旋风不仅席卷了产业界,也在科学创新领域产生了深远影响。中国的新型研发机构积极响应联合国教科文组织的《开放科学建议书》,致力于推动数据共享和开源科学的发展。

以之江实验室为例,该机构自去年开始便在全球范围内邀请公测地学基础模型GeoGPT。GeoGPT不仅为全球地学研究提供了强大的研究工具,还以极为彻底的态度开放资源,形成了科学基础模型的系统架构。本月,GeoGPT将正式面向全球科学界发布,并同步开源模型架构、训练模型的数据列表等更多成果。

中国模型开源的浪潮正以前所未有的信息透明度改变着全球人工智能的发展格局。更多元的角色有机会加入创新行列,获得发展权。一个以开源模型为基石的世界创新生态网正在加速形成。硅谷将DeepSeek视为中国“给世界的礼物”,这充分体现了中国开源力量在全球范围内的认可度和影响力。

在这场开源浪潮中,浙江杭州展现出了极强的存在感。新锐创业企业DeepSeek、科技龙头阿里云和承担国家科技使命的非营利性新型研究机构之江实验室,形成了创新“三剑客”,以不同的机制全面呼应这一浪潮。这三家机构在人工智能领域的探索与实践,不仅为中国参与全球竞争提供了有力支持,也为其他国家和地区提供了宝贵的经验和启示。

OpenAI的CEO山姆·奥特曼曾在一次公开场合表示,初创公司用1000万美元与OpenAI竞争是没有希望的。然而,中国的DeepSeek却以极低的成本和极高的效率挑战了这一断言。DeepSeek的成功不仅证明了中国在人工智能领域的创新能力,也为全球开源运动注入了新的活力。

随着全球人工智能竞争的日益激烈,中国开源新势力正面临着前所未有的挑战和机遇。如何在保持创新的同时应对竞争压力,成为摆在中国开源力量面前的重要课题。但无论如何,中国开源新势力已经展现出了强大的生命力和发展潜力,必将在未来的人工智能领域中发挥更加重要的作用。