网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

全模态时代来临:从Google Omni到Minimax,谁将引领AI新变革?

2026-05-20来源:互联网编辑:瑞雪

在Google I/O大会前夕,科技圈迎来了一则重磅消息:Google正式推出Gemini Omni,这款被外界视为AI领域“全能选手”的新产品,凭借其多模态交互能力迅速成为焦点。与传统AI工具聚焦单一任务不同,Omni通过整合文本、图像、视频、音频等多种模态,试图构建一个“一站式”生产力入口,重新定义了AI Agent的边界。

Omni的核心突破体现在两个层面。其一,它支持通过自然语言指令直接生成完整教学视频。例如,用户仅需输入“一位教授在黑板上推导三角恒等式并同步讲解”,系统便能自动生成包含粉笔动作、公式书写、语音解释的动态视频,无需分步骤操作或反复修正。这一能力背后,是AI对物理空间关系、逻辑推理和内容准确性的深度理解,而非简单的画面拼接。其二,Omni将Google分散的AI能力整合至单一对话框中,用户可同时完成写作、绘图、视频剪辑、跨任务记忆等操作,彻底告别多工具切换的繁琐流程。这种设计直击企业级用户的痛点——此前,某头部大厂引入AI编码工具后,虽提升了交付速度,却因需求质量参差不齐导致预算超支,暴露出单一模态工具的局限性。

市场对“全模态”的期待并非空穴来风。以视频制作为例,传统流程需依次调用文本模型生成脚本、图像模型设计封面、视频工具剪辑画面、音乐模型匹配配乐,任何一个环节出错都需推倒重来。而全模态系统可同步处理多种信息形态,显著降低试错成本。Google的转型更具象征意义:其此前将视频生成(Veo)、文本处理(Gemini)、图像生成(Imagen)拆分为独立产品,而Omni的推出标志着公司正式押注统一架构,回应了业界对“AI能否真正理解复杂世界”的质疑。

在国内市场,Minimax成为少数在全模态领域与谷歌正面竞争的独立AI公司。其M2系列模型在2026年初的Token用量较2025年底激增6倍,每分钟处理量(TPM)以每周10%-20%的速度增长,显示出强劲的市场需求。更引人注目的是其商业模式:通过优化推理服务器配置,Minimax实现单台设备每分钟1美元营收,而运营成本不足0.3美元,单位经济效益远超行业平均水平。这种“低成本、高毛利”的特性,使其在无需依赖广告投放的情况下,仅靠工具价值便实现用户自发增长——2025年营销费用同比下降40.3%,而毛利率从12.2%提升至25.4%。

资本市场的反应印证了全模态的战略价值。摩根士丹利预测,Minimax的年化经常性收入(ARR)将在2026年底突破10亿美元,与国际巨头处于同一量级。其背后的逻辑在于,全模态能力可同时覆盖企业级(ToB)和消费级(ToC)市场:企业用户需要高效处理跨模态任务,而个人用户则期待通过单一入口完成创作、办公等场景需求。Minimax的全球化布局进一步放大了这一优势——相比多数AI公司仅聚焦单一市场,其双线作战策略显著提升了增长天花板。

技术层面,Minimax的“模型+工程层”双轮驱动模式成为关键护城河。以视频生成为例,其下一代模型Hailuo 3预计将大幅提升理解能力,并通过工程优化降低使用门槛,使非专业用户也能轻松创作。在办公场景中,M3模型将强化AI Agent的多步骤任务规划能力,配合创新工具MaxHermes,实现从代码生成到日程管理、跨应用协作的扩展。瑞银分析指出,多模态训练产生的视觉理解能力可反哺文本模型,推动整体智能水平跃升,这种“1+1>2”的效应将成为Minimax的核心竞争力。

随着Gemini Omni的发布,全模态竞争已从技术概念进入商业化落地阶段。谷歌的转型与Minimax的崛起,共同指向一个趋势:未来的AI Agent必须具备“看、听、说、写、画”的综合能力,才能适应真实世界的复杂性。当市场从“流量竞争”转向“模型竞争”,那些能同时平衡技术深度与商业效率的玩家,或将主导下一轮增长周期。

谷歌开发者大会亮点频出:AI赋能搜索代码 视频生成新模型登场
谷歌还推出了旗舰AI模型的新版本Gemini 3.5 Flash,并称其是迄今为止最强的编程模型。 谷歌还把编程功能整合进搜索引擎,订阅用户将可以在搜索中创建自定义仪表盘,用于管理婚礼筹备、健身计划等任务。…

2026-05-20

谷歌I/O大会AI火力全开:从搜索到眼镜,谷歌要靠AI重塑未来?
过去一年,AI 成了所有行业的主旋律,Gemini 在 Google 的定位,也开始从一个独一的 App,成了所有 Google产品里的最重要的 AI 底层能力。 在进入 Gemini App、Googl…

2026-05-20

石头科技:以技术创新拓展智能清洁边界,引领智能家居迈向空间管理新时代
这项创新不仅提升了设备对障碍物的识别能力,还赋予其完成开合抽屉、整理物品等拟人化动作的能力,为智能家居场景注入了更多可能性。石头科技通过持续的技术突破,不仅重新定义了清洁机器人的功能边界,更在推动整个行业向空…

2026-05-20

小米17 Max续航实力大揭秘:长视频测试表现亮眼,力压两台iPhone 17 Pro Max
IT之家 5 月 19 日消息,小米手机官方今日发布视频,测试了全新小米 17Max 手机在 Bilibili 长视频场景下的续航表现。据介绍,全新小米 17 Max 手机首搭 8000mAh 小米金沙江电…

2026-05-20