网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

谷歌Gemini Omni多模态大模型发布:支持混合输入,对话实时编辑生成多元内容

2026-05-20来源:互联网编辑:瑞雪

在谷歌2026 I/O开发者大会上,一款名为Gemini Omni的全模态大模型正式亮相,成为全场焦点。这款模型突破了传统AI在模态处理上的割裂状态,实现了文本、图像、音频、视频等多种信息形式的深度互通与自由生成。

Gemini Omni的核心能力被概括为“任意输入、任意输出”。无论是手绘草图、文字描述,还是图片、音频、视频素材,用户都可以自由组合输入模型。系统能够自主解析信息逻辑,并模拟真实物理规则,最终生成高精度、符合现实逻辑的多元化内容,包括视频、图像和文本等。

支撑这一强大功能的是谷歌的三大核心技术底座:世界模型Genie、图像模型Nano Banana和视频生成模型Veo。这三项技术共同构建了Gemini Omni的全模态AI框架,使其能够处理复杂的多模态任务。

在发布会上,Gemini Omni的对话式实时编辑能力成为最大亮点。与传统AI生成工具一次性输出、修改繁琐不同,这款模型支持用户在生成过程中通过自然语言对话进行交互式迭代优化。例如,用户可以精准调整视频场景、修改物体材质或调整动态特效,而修改过程不会破坏画面的整体逻辑和物理效果。

现场演示中,工作人员仅用手绘简易图形和文字指令,便生成了一段带有物理碰撞效果的完整特效视频。这一展示直观展现了Gemini Omni在内容创作领域的强大潜力,为AI技术的应用开辟了新的可能性。

谷歌发布Gemini 3.5系列模型及Omni世界模型 推动AI应用与视频生成新进展
财联社5月20日讯(编辑 牛占林)在全球人工智能(AI)竞争加剧的背景下,谷歌宣布推出Gemini 3.5系列模型,以及一款用于模拟物理世界的新型AI模型,旨在在模型开发方面保持领先,同时为其庞大的用户群提供…

2026-05-20

田曦薇代言vivo S60系列5月29日发布,颜值配置双在线,中端机市场再添强将
vivo产品经理@韩伯啸 这段时间已经提前透露了部分核心配置,同时网上爆料也曝光了该机的不少细节,可以说每一条都踩在中端机用户最在意的点上。 问题也随之而来,各大厂商很快将推出各自的中端旗舰手机,比如vivo…

2026-05-20

百度2026年Q1财报:总营收321亿,AI业务占比首过半,李彦宏看好智能体市场
《科创板日报》5月19日讯(记者 黄心怡),百度发布2026年第一季度财报,显示季度总营收321亿元,同比小幅下降约1%;归属百度的净利润为34.45 亿元,同比下降 55.36% ;非公认会计准则下归属百…

2026-05-20

石头科技持续突破:从智能扫地到户外割草,开启家居清洁多维新体验
在智能家居清洁领域,石头科技正以技术创新为动力,不断扩展其产品线,提升用户的生活品质。如今,石头科技已经构建起覆盖智能扫地机器人、洗地机和智能割草机的多元化产品矩阵,旨在通过不断的迭代与升级,为全球用户提供更…

2026-05-20