网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

图森未来发布Ruyi视频大模型,消费级显卡即可运行

2024-12-17来源:ITBEAR编辑:瑞雪

图森未来近期在人工智能领域迈出了重要一步,正式推出了名为“Ruyi”的图生视频大模型,并慷慨地将Ruyi-Mini-7B版本向公众开源,用户现可通过huggingface平台轻松下载并使用这一创新工具。

Ruyi是一款基于DiT架构的视频生成模型,其设计理念独特,由两大核心模块构成:一是Casual VAE模块,负责高效处理视频数据的压缩与解压;二是Diffusion Transformer模块,专注于生成经过压缩的视频内容。这款模型拥有约71亿个参数,经过大量训练,涉及约2亿个视频片段,旨在为用户提供前所未有的视频生成体验。

图森未来在设计Ruyi时,充分考虑了用户的实际需求,特别优化了模型在消费级显卡上的运行效率,如RTX 4090等,确保用户无需高端硬件也能轻松体验。Ruyi还配备了详尽的部署指南和ComfyUI工作流,即便是初次接触的用户也能迅速上手。

Ruyi的功能性同样令人瞩目,支持多分辨率、多时长的视频生成,分辨率范围从384*384到1024*1024,任意长宽比,最长可达120帧或5秒的视频内容。用户还可通过控制首帧和首尾帧来定制视频,最多可设置5个起始帧和5个结束帧,通过循环叠加,实现任意长度的视频创作。

更Ruyi还提供了4档运动幅度控制和5种镜头控制选项,包括上、下、左、右移动和静止,使用户能够更精细地调控画面变化和镜头切换,为视频创作增添更多可能性。

然而,Ruyi目前仍存在一些不足,如手部动作可能显得不够自然,多人场景中的面部细节有时会出现失真,以及不可预测的转场效果。图森未来对此表示,团队正在积极改进这些缺点,并计划在未来的更新中逐步修复。

图森未来强调,Ruyi的发布旨在利用大模型技术缩短动漫和游戏内容的开发周期,降低制作成本。目前,Ruyi已经能够根据用户输入的关键帧,自动生成接下来的5秒内容,或根据两个关键帧生成中间的过渡画面,极大地提升了创作效率。未来,图森未来还将推出更多版本的Ruyi,以满足不同创作者的多样化需求。

对于想要探索Ruyi-Mini-7B版本的开发者,可以访问以下开源链接:

百度AI成果井喷:从智能涌现到效果涌现,产业结构迈向健康倒金字塔
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-15

百度世界大会:李彦宏携AI“军火库”全面开放,开启应用新篇章
现场演示连线数字人罗永浩环节上,出现了“翻车”这一尴尬现象时,李彦宏的情绪也并没有太多波动,而是感觉“有点遗憾”,并表示“其实我们在之前演练的过程当中觉得这个效果还是非常令人惊艳的”。 还有大模型层面上的文…

2025-11-15

百度世界大会发布AI新成果:文心5.0等亮相,李彦宏畅谈AI内化生产力变革
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-13

百度“文心杯”第三届落幕:8支团队获千万投资,李彦宏力推AI应用普及
李彦宏表示,我们看到越来越多的创业者在各种场景发现AI的新能力、新效果,希望更多的人能够加入这个发现之旅,也正基于此,百度连续三年举办“文心杯”创业大赛。 第三届“文心杯”创业大赛8支优胜团队共获得数千万元…

2025-11-13

2025百度世界大会聚焦AI发展:成果发布,内化能力引领新质生产力变革
本届大会以“效果涌现”为主题,聚焦国产芯片最新进展、大模型升级、AI应用创新与全球出海,呈现了百度作为中国人工智能领军企业,如何将AI技术内化为产业发展的原生动能,为加快形成新质生产力提供可落地的“百度方案”…

2025-11-13