网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

快手新动作!联合推出开源文生视频AI模型,效果如何?

2024-10-12来源:ITBEAR编辑:瑞雪

近日,快手科技、北京大学和北京邮电大学携手,共同推出了Pyramid Flow文生视频模型。这款模型能够根据用户输入的文本,生成最长可达10秒、分辨率为1280x768、帧率为24fps的高质量视频。这一创新成果为开发者、艺术家和创作者们带来了更高效、更灵活的视频生成解决方案,并已在Hugging Face平台上线,实现完全开源。

Pyramid Flow的核心优势在于其高效生成的能力。该模型采用新技术,通过统一的AI模型分阶段生成视频,其中大多数阶段为低分辨率,仅在最后阶段达到全分辨率。这种“金字塔流匹配”方法在保持视频高视觉质量的同时,大幅降低了计算成本,其tokens数量仅为传统diffusion模型的四分之一。

在推理速度方面,Pyramid Flow同样表现出色。它能够在56秒内生成一个5秒、384p的视频,速度上媲美甚至超过了许多全序列diffusion模型。

Pyramid Flow在MIT许可证下发布,允许包括商业应用、修改和再分发在内的广泛使用。这一开源和商业友好的政策,吸引了众多希望将模型集成到专有系统中的开发者和公司。

阿里“C计划”蓄势待发:对话式AI赛道加速布局,争夺生态核心入口
而如今夸克推出“C 计划”,目的正是在对话式 AI 这一赛道完成突破,让夸克不再局限于搜索工具的标签,而是通过更自然、更深度的对话交互,将AI 能力渗透到学习、办公、生活服务等高频场景,真正从工具应用升级…

2025-10-23

AI科学家携手创业!ChatGPT核心成员与DeepMind大将共探材料科学新领域
他领导的GNoME项目在2023年利用AI发现了超过200万种全新晶体材料,是哈佛大学凝聚态与材料物理和计算科学的博士。 简单来说,他们要让AI像真正的科学家一样,能够提出假设、设计实验、操作仪器、分析结果…

2025-10-22

阿里夸克“C计划”或引AI新角逐 聚焦对话式AI欲战字节跳动?
这或对阿里的核心业务边界形成了潜在压力,阿里推出“C计划”可能是一场“攻防兼备”的战略行动。夸克作为阿里在信息服务领域的重要棋子,月活也已超1.5亿,其与电商、本地生活、云业务等虽有关联但更具独立性。 …

2025-10-22