小米MiMo-V2-Flash模型发布：架构创新成本低性能比肩头部开源模型-网界

小米近日正式推出并开源全新大模型MiMo-V2-Flash，凭借3090亿总参数与150亿活跃参数的规模，在性能表现上与DeepSeek-V3.2、Kimi-K2等头部开源模型形成有力竞争。该模型采用专家混合架构（MoE），通过架构层面的突破性创新，将推理速度提升至150 tokens/秒，同时将输入成本压缩至每百万token仅0.1美元，输出成本0.3美元，在性价比维度树立新标杆。

在基准测试中，MiMo-V2-Flash展现多维优势：AIME 2025数学竞赛与GPQA-Diamond科学知识测试均位列开源模型前两名；编程能力尤为突出，SWE-bench Verified测试得分73.4%，超越所有开源竞品，直逼GPT-5-High水平。该测试要求AI修复真实软件漏洞，73.4%的成功率意味着其已具备解决大部分实际编程问题的能力。多语言编程测试SWE-Bench Multilingual中，模型以71.7%的解决率进一步验证跨语言开发实力。

智能体任务测试数据显示，模型在τ²-Bench分类任务中，通信类得分95.3、零售类79.5、航空类66.0；BrowseComp搜索代理基准测试中，基础得分45.4，启用上下文管理后跃升至58.3。这些成绩表明，MiMo-V2-Flash不仅能处理代码生成等单一任务，更可理解复杂逻辑并执行多轮智能体交互。值得关注的是，其文本生成质量已接近顶级闭源模型，具备成为全能型日常助手的潜力。

支撑模型性能突破的是两项核心技术：混合滑动窗口注意力机制通过5层滑动窗口（每层128 token）与1层全局注意力的交替设计，使KV缓存存储量减少近6倍，同时维持256k超长上下文窗口能力；轻量级多Token预测（MTP）模块实现并行生成2.8-3.6个token，推理速度提升2-2.6倍，训练阶段采样效率同步优化。研究团队特别指出，128 token窗口大小经实验验证为"最佳甜点值"，盲目扩大窗口反而导致性能下降。

训练效率方面，模型采用FP8混合精度技术，在27万亿token数据上完成预训练，原生支持32k序列长度。后训练阶段创新提出多教师在线策略蒸馏（MOPD），通过学生模型自主采样、多专家教师实时反馈的机制，仅需传统方法1/50的算力即可达到同等性能峰值。该框架支持动态接入新教师模型，形成"教学相长"的闭环进化系统。

针对开发者场景，MiMo-V2-Flash提供256k上下文窗口，可支持数百轮智能体交互与工具调用，与Claude Code、Cursor等主流开发环境无缝兼容。技术团队基于真实GitHub issue构建超10万个验证任务，通过Kubernetes集群实现10000+并发Pod部署，环境部署成功率达70%。网页开发任务中引入的多模态验证器，通过视频录制替代静态截图验证代码执行结果，有效减少视觉幻觉问题。

目前，小米已将完整模型细节、推理代码及基础权重（含MiMo-V2-Flash-Base）通过MIT许可协议在Hugging Face平台开源，并在LMSYS博客分享优化经验。该模型现已在API Platform限时免费开放，开发者可直接调用体验。

1.27亿元广西南宁数实融合大单揭晓京东领跑中标榜首
2025-12-17

“天才少女”罗福莉首秀小米演讲，解锁MiMo大模型及小米AI新路径

2025-12-17

三星Galaxy S26 Ultra亮点抢先看：AI防窥屏、60W快充等成独家优势

2025-12-17

华为nova 15系列12月22日发布！官网已上架，外观存储配置全揭晓

2025-12-17

监管核准！施贵忠获任龙陵农商行董事长 3个月内须到任履职

2025-12-17

QuestMobile2025新媒体报告：微博AI交互领跑，日均8.1次成用户“刚需”伴侣

2024 年，面对AI这一全球科技巨头竞相布局的核心赛道，微博基于DeepSeek大模型技术及平台内容生态，推出了AI 搜索产品“微博智搜”，为用户提供"热点追踪-即时搜索-深度解析"的闭环体验。此次报告中“…

2025-12-17

苹果iOS 26.3首个测试版来袭：新增三大功能，升级前需了解这些

在 iOS 26.3 Beta 1 中，进入「设置 → 通用 → 传输或还原 iPhone」，可以看到新增了「传输至安卓」的入口。在连接方式上，iPhone 提供了两种配对方案：一是扫描安卓设备上显示的二…

2025-12-17

vivo S50系列焕新登场：美学影像性能全升级，2999元起拥抱年轻新体验

针对夜景和复杂光线人像场景，vivo S50 Promini进一步强化影像硬件与算法，搭载索尼IMX921超感光仿生大底主摄，配合vivo自研Vcs仿生感光技术，提升暗光环境下的信噪比与色彩还原。以旗舰规…

2025-12-17

小米MiMo-V2-Flash模型发布：架构创新成本低 性能比肩头部开源模型

小米MiMo-V2-Flash模型发布：架构创新成本低性能比肩头部开源模型