网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

阿里通义万相2.1大升级:视频图像生成能力显著增强,中文文字视频首亮相

2025-01-10来源:ITBEAR编辑:瑞雪

阿里巴巴旗下的通义万相近日宣布了其2.1版本模型的重大升级,此次升级在视频与图像生成能力上实现了显著提升,为用户带来了更为丰富和高质量的创作体验。

在视频生成领域,通义万相2.1凭借自研的高效VAE和DiT架构,显著增强了时空上下文建模能力。这一技术突破使得系统能够支持无限长1080P视频的高效编解码,大大提升了视频处理的灵活性和效率。尤为新版本首次实现了中文文字视频生成功能,并在VBench榜单上荣登榜首,彰显了其在视频生成技术上的领先地位。

通义万相2.1不仅支持中英文视频的一键艺术字生成,还提供了多种视频特效选项,如过渡效果、粒子效果和模拟效果等,极大地丰富了视频的视觉表现力。无论是制作宣传视频还是个人短片,用户都能轻松实现专业级的视觉效果。

在图像生成方面,通义万相2.1同样表现出色。新版本采用了IC-LoRA图像生成训练方法,结合DiT架构,显著增强了文本到图像的上下文能力。用户只需对多张图像进行拼接与联合描述,即可实现关联图像间的组合生成,并保持特征稳定连续。这一功能为设计师和摄影师提供了更多创意空间,让图像创作更加便捷和高效。

通义万相2.1还支持复杂运镜,能够还原碰撞、反弹、切割、挤压等真实世界的物理规律。例如,在模拟雨滴落在伞面上的场景中,系统能够精确呈现水花溅起的细节,使画面更加逼真和生动。这一功能在广告制作、动画制作等领域具有广泛的应用前景。

安谋科技发布“周易”X3 NPU IP,AIGC大模型能力跃升开启端侧AI新篇
智东西11月14日消息,昨日,安谋科技正式发布了专为端侧大模型而生的最新一代NPUIP——“周易”X3,其能够与Arm架构CPU、GPU协同,组成基于Arm生态的异构算力解决方案。 新的“周易”X3 NP…

2025-11-15

百度李彦宏2025世界大会发声:AI内化驱动,开启生产力革命新篇章
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14