网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

字节Seedance 2.0论文亮相:170人团队署名,吴永辉曾妍领衔,技术突破引关注

2026-04-17来源:天脉网编辑:瑞雪

字节跳动旗下AI视频生成技术Seedance 2.0近日在学术平台arXiv发布技术论文,同步公开26页详细评测报告及170人完整研发团队名单。这项被业界称为"现象级"的多模态视频生成技术,通过原生统一模型架构实现了文本、图像、视频、音频的跨模态理解与生成,在动作自然度、音画同步性、导演级分镜控制等维度达到行业领先水平。

技术突破直指传统生成式工具的核心痛点。过往模型依赖单一文本输入,在整合品牌素材、配音、历史片段时存在显著一致性缺陷,创作者需经历数十次试错才能获得可用成果。Seedance 2.0通过构建四模态统一理解框架,支持混合输入指令的实时解析,使人物运动轨迹更符合物理规律,多人交互场景不再出现逻辑错乱。其自研的音画对齐算法可精准匹配口型、脚步声、背景音乐与画面动态,在评测中实现98.7%的同步准确率。

该技术已通过Byteplus平台向全球100余个国家企业开放API调用服务,支持生成4-15秒、分辨率最高达720p的短视频内容。值得注意的是,服务覆盖范围特意排除了美国市场。企业用户可实现剧情脚本的自动分镜、运镜设计与节奏剪辑,还能对指定角色、动作或场景进行局部修改,或在现有视频基础上无缝续拍新内容。

在VBench等主流基准测试中,Seedance 2.0在质量、运动合理性、语义一致性等23项指标中全面领先同期竞品。论文披露的对比数据显示,其人物动作自然度评分超出第二名14.6个百分点,复杂场景生成效率提升3倍以上。研发团队特别强调,模型通过引入物理引擎约束模块,使奔跑、打斗等动态场景的失真率降低至2.3%。

团队构成显示剧烈人事变动:相较1.5 Pro版本,现有170人团队中有89人离职,同时引入62名新成员,核心研发层保持稳定。基础研究负责人吴永辉直接向CEO梁汝波汇报,预训练技术路线由位于帕洛阿尔托的曾妍团队主导。值得关注的是,抖音副总裁李亮近日否认了"亿元年薪挖角"传闻,但确认Seed团队采用"现金+字节期权+豆包期权"的复合薪酬体系,期权四年全部归属,业务发展良好时技术人员收益可能达数亿元级别。

高德布局机器人领域,首款具身智能四足机器人2026年北京亦庄首秀
据知情人士透露,四足机器人与人形机器人均被列入了该部门的长期产品规划路线图。 高德在最新声明中确认了上述业务进展,表示团队正持续迭代具身智能模型,并积极推进四足及人形机器人的研发探索,其首款四足机器人预计将于…

2026-04-17

阿里巴巴旗下高德ABot-PhysWorld登顶WorldArena,具身智能布局再进一步
4月15日,一款标注为来自阿里巴巴的世界模型ABot-PhysWorld,登顶世界模型领域的权威评测WorldArena,备受业界关注。今年2月,高德发布两款ABot系列基座模型,分别是具身操作基座模型ABo…

2026-04-17

雷军亲测小米SU7京沪续航,紧张筹备15小时直播,诚意与实力并存!
小米汽车创始人雷军,突然曝出惊人言论:为了即将开启的小米 SU7 京沪 1265 公里续航直播测试,他已经紧张到好几天没睡好觉,甚至祈祷 “明天千万别下雨”,生怕影响测试结果,引发全网心疼与热议。续航是新能源…

2026-04-17