在今日举行的年度开发者盛会上,谷歌正式发布多款人工智能创新产品,并宣布多项技术升级计划。此次大会推出的Gemini系列模型成为核心亮点,其中Gemini Omni作为新一代多模态生成模型,支持视频内容实时编辑与元素替换功能,用户可通过对话形式直接修改视频素材。该模型融合了Nano Banana与Veo等生成技术,未来将扩展至全模态内容生成领域。
针对不同应用场景,谷歌同步推出Gemini 3.5 Flash与Pro版本。前者在基准测试中展现超越前代3.1 Pro的性能表现,现已全面开放至谷歌生态产品及API接口;后者则处于内部测试阶段,预计下月正式发布。配套推出的Gemini应用程序采用全新神经交互设计,支持跨平台同步操作,付费用户可优先体验视频生成功能,未来还将适配方言识别系统。
在智能助手领域,谷歌推出每日简报等定制化服务,付费用户即日起可通过语音指令获取个性化资讯摘要。针对Mac用户开发的专属应用,实现文件批量处理与语音操控功能,演示中展示的邮件自动生成场景,通过整合Finder文件管理与Gmail服务完成全流程操作。科学计算领域则推出Gemini for Science工具集,配备AI研究协作伙伴Co-Scientist。
个人AI助手Gemini Spark引发关注,其基于云端虚拟机实现24小时持续运行,支持多任务并行处理与子任务规划。用户可通过应用、短信或邮件进行交互,首批功能将于下周面向美国Ultra订阅用户开放,夏季扩展至Chrome浏览器。该助手集成Antigravity技术,可自动生成数据仪表盘等复杂界面。
搜索业务迎来重大革新,AI模式与概览功能整合至统一界面,搜索框支持多媒体内容输入,包括图片、视频及文档文件。智能代理系统可监控股市动态、商品发售等实时信息,夏季将推出网页变更提醒服务。编码搜索功能允许用户构建自定义交互组件,生成式界面设计工具将于夏季免费开放。
购物体验升级方面,谷歌推出跨平台通用购物车,支持在Gmail、YouTube等场景添加商品,结账时可选择谷歌或第三方零售商。代理支付协议允许AI根据用户设定参数自动完成交易,该功能将随Gemini Spark后续更新上线。YouTube平台测试"Ask YouTube"功能,通过上下文感知技术实现连续对话交互。
硬件合作领域,谷歌联合眼镜品牌推出首款Android XR音频眼镜,配备拍照、通话及多媒体功能,支持全天候AI语音交互。三星负责硬件开发工作,产品秋季上市时可兼容iOS设备。价格体系调整中,Ultra订阅套餐降至200美元,新增100美元基础套餐选项。
创意工具方面,Google Flow工作室上线Gemini Omni支持,用户可同时操控多个AI代理完成复杂项目。图像生成工具Google Pics对标Canva,支持海报、信息图设计并添加数字水印。协作设计平台Stitch新增实时编辑功能,可直接导出代码至Antigravity环境并部署至Netlify平台。这些更新即日起陆续推送,部分功能将于年内完成全平台覆盖。