国产大模型领域迎来重要突破,MiniMax稀宇科技今日正式推出其最新力作——MiniMax M3模型。该模型凭借"前沿编码与智能体能力、百万级上下文窗口、原生多模态架构"三大核心优势,成为国内首个实现完整前沿能力落地的开放世界模型。

在编码能力评测中,M3展现出行业顶尖水平。通过自主任务拆解、多步推理和工具调用能力,该模型生成的代码可直接交付使用,突破了传统模型"能运行但需人工修改"的局限。基于自研的MiniMax Sparse Attention(MSA)架构,M3的API接口最高支持100万tokens的上下文窗口,确保至少51.2万tokens的有效使用,为长程智能体操作、复杂代码编写和长视频理解提供了基础设施支撑。
多模态能力方面,M3通过重构数据管线将预训练数据规模扩展至百T级别,从底层架构实现文本与视觉语义空间的高度对齐。这种原生多模态设计使其能够同时处理文字、图像、图表等多种信息形式,在BrowseComp智能体评测中以83.5分超越Opus 4.7(79.3分),验证了其自主浏览与信息检索的卓越能力。
实际测试中,M3展现了惊人的自主工作能力。当被要求复现ICLR 2025杰出论文《Learning Dynamics of LLM Finetuning》的核心实验时,该模型连续运行12小时,自主完成18次代码提交和23张实验图表生成,成功跑通全部关键实验。其多模态理解能力可准确解析论文中的图表公式,长上下文窗口确保论文、代码和实验日志的完整处理,编程与智能体能力则驱动整个长线程任务的执行。

在更具挑战性的全流程自主训练测试中,M3接收四个仅完成预训练的Base模型后,在12小时内独立完成数据合成、模型训练、效果评测和迭代优化的完整闭环。整个过程无需人工干预,最终在数学推理、代码生成和知识问答等任务上取得37.1分的综合成绩,仅次于Opus 4.7(42.4分)和GPT-5.5(39.3分),位列全球第三。这项测试充分验证了M3作为前沿大模型的完整技术栈实力。


