网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

阿里Qwen3登顶全球最强开源模型,性能卓越成本仅DeepSeek-R1三分之一

2025-04-29来源:ITBEAR编辑:瑞雪

在科技界的瞩目之下,阿里巴巴于近日震撼宣布,其倾力打造的新一代通义千问大模型Qwen3(简称千问3)已正式向全球开源,这一举动不仅标志着中国在AI领域的重大突破,也让千问3一跃成为全球最强的开源模型。

更令人惊叹的是,千问3在性能和成本控制上实现了质的飞跃。它以DeepSeek-R1三分之一的参数规模,却全面超越了其性能。在代码生成、数学推理以及通用能力等基准测试中,千问3均刷新了全球开源模型的记录,同时训练和部署成本大幅降低。

千问3的三大核心优势尤为突出:卓越的性能、低廉的成本以及全面的开源。其混合推理架构重塑了行业标准,显存占用仅为竞品的1/3,全球用户都能畅享AI技术的红利。这一开源举措,无疑将加速AI技术在全球范围内的普及和应用。

在性能方面,千问3作为国内首个实现混合推理的模型,深度融合了人类直觉思维与逻辑推演机制。它既能快速响应简单问题,又能深入推理复杂问题,这种能力在热门模型中极为罕见。目前,仅有千问3、Claude3.7以及Gemini 2.5 Flash能够做到这一点。混合推理的实现,需要极其精细和创新的设计及训练,千问3的成功无疑树立了新的标杆。

千问3还构建了覆盖全场景的工业化模型体系,共包含8款差异化模型,满足从边缘计算到企业级应用的多样化需求。无论是旗舰级的Qwen3-235B-A22B,还是轻量化的Qwen3-30B-A3B,都能在不同的场景下发挥出色的性能。这些模型均遵循Apache 2.0开源协议,开发者可根据具体需求灵活选择部署方案。

在成本控制方面,千问3同样表现出色。仅需4张H20 GPU便能部署完整功能的千问3模型,显存占用量仅为同类性能模型的三分之一。这一技术突破显著降低了硬件资源需求,使得顶尖AI模型的应用准入门槛大幅降低。以旗舰版千问3为例,其庞大的架构仅需4张H20 GPU或同等算力设备即可流畅运行,而相比之下,满血版DeepSeek-R1的硬件总成本高达约200万元。

千问3的开源策略更是将AI技术推向了新的高度。全系列模型采用宽松的Apache2.0协议开源,全球开发者、研究机构和企业均可免费下载模型并商用。这一开放举措将加速AI技术在终端场景的规模化落地,为各行业带来普惠性的智能升级机遇。同时,千问3还支持高达119种语言和方言,为全球各国各地区的人们提供了强大的AI技术支持。

尤其千问3的开源对于缺乏自研能力的国家和地区而言,意味着其本土语言首次获得了强大的AI技术支持。这一举措无疑将促进全球AI技术的均衡发展,让更多的人享受到AI带来的便利和福祉。

阿里巴巴“通义”App升级更名“千问”,AI战略转向消费级市场新布局
根据官方消息,“千问”定位为阿里旗下最重要的大模型应用入口,其核心能力基于阿里自研的大模型体系Qwen(千问)。 分析人士指出,阿里此前在To B市场和模型研发侧拥有技术基础,但在消费端应用分发层面还未形成…

2025-11-15

Dexmal原力灵机获近10亿融资 阿里蔚来资本助力具身智能研发落地
IT之家 11 月 14 日消息,具身智能公司 Dexmal 原力灵机今日宣布完成数亿元 A+ 轮融资,阿里巴巴为独家投资方。IT之家注意到,该公司 A 轮融资由蔚来资本领投,洪泰基金、联想创投、锡创投和正…

2025-11-14

百度世界大会发布文心大模型5.0 参数量2.4万亿能力达全球领先
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-13