
三个月前,OpenAI关停了Sora。那个曾经被全网吹上天的AI视频产品,上线不到15个月,网页端和App在4月26日停服。当时业内一片哗然,很多人觉得AI视频这事儿可能没想象中那么好做。
6月23日,北京国家会议中心,火山引擎总裁谭待在FORCE原动力大会上公布了Seedance 2.5。单段原生直出30秒视频,支持一次性导入50个全模态素材,自带4K分辨率和局部重绘编辑能力。目前该模型处于全球企业内测阶段,预计将于7月初正式上线。
而就在一天前,6月22日,阿里云悄无声息地发布了HappyHorse 1.1。五大维度系统升级,运动系统重写,新增参考图转视频模式。
两家大厂48小时内接连放大招,夹击的是一个OpenAI已经主动放弃的赛道。
AI视频生成有一个所有玩家都绕不开的核心指标:单次生成时长。这个指标直接决定了AI视频能不能从"炫酷的玩具"变成"能用的工具"。
5秒钟的视频只能算一个动图,10秒钟勉强算一个镜头,15秒能讲一个极短的片段。但当视频长度拉到30秒,事情就变了。30秒意味着一个完整的叙事单元,一条有开头有结尾的短视频广告,一段不需要拼接的连贯长镜头,一支可以直接发在抖音上的完整内容。
在此之前,整个行业的天花板在15到20秒之间。Seedance 2.0和HappyHorse 1.0在今年2月和4月先后把15秒做到了可用级别,Google的Veo 3.1和快手的可灵3.0也在这个区间。Sora 2 Pro生前最长能做到25秒,已经是海外模型里的极限,现在随着Sora的关停成了绝唱。
▲数据来源公开数据,由Claw123整理
如今,Seedance 2.5直接把这个数字翻了一倍。OFweek在报道中引用业内人士的判断:"做连贯长镜头、完整小故事不用分段拼接,画面叙事流畅度完全不一样。"在时长这个维度上,Seedance 2.5目前没有对手。
但相关业内人士对Claw123表示,按行业迭代节奏,这个窗口期可能维持两到三个月。
▲Seedance 2.5的3大功能亮点
更值得关注的是50个全模态素材联合输入。以前的视频生成模型,给一段文字或一张参考图就不错了。Seedance 2.5允许同时丢进去文字、图片、音频、视频,最多50个素材,通过多素材约束让输出越来越接近你脑子里的画面。意味着一个广告团队可以把品牌手册、产品3D模型、代言人照片、配乐Demo和分镜脚本同时扔进去,模型一次性整合生成符合品牌调性的30秒广告片。这是目前已知上限最高的商业视频生成模型。再配合局部重绘能力,不满意的局部直接改,不用整段重来。
HappyHorse 1.1支持最多9张角色参考图同时输入。9对50,这个差距比时长翻倍更刺眼。在多角色短剧、多人物广告等场景中,9张参考图足以应对大部分需求,但面对更复杂的品牌资产整合,50份素材的灵活性是降维打击。
如果说时长是Seedance 2.5的绝对长板,那画面质量的争夺就精彩得多了。
Claw123了解到,相比1.0版本,HappyHorse1.1在动态表现力、主体一致性、指令遵循、视觉质感和音频能力五个维度进行了系统性升级。针对1.0版本画面动作迟缓、节奏不足的问题,1.1重写了运动建模与时序一致性,提升了动作的连贯性和力量感,1.1新增了Reference-to-Video模式,最高支持9张参考图同时输入。
▲截图自千问X主页
VentureBeat在6月23日的报道标题直接用了"Alibaba's AI video model rises to No. 2 in global rankings, as OpenAI's Sora and ByteDance's Seedance fall away"这样的措辞。虽然"fall away"带有标题党成分,但HappyHorse从4月匿名登顶到1.1系统升级,只用了不到三个月,这个迭代速度确实在给字节施压。
但此次FORCE原动力大会上,SeeDance 2.0 的画质也直接提升到了原生 4K。同时Seedance 2.0 原生 4K 还率.........
视频生成赛道的两种打法
原文转载:https://www.kjdsnews.com/a/2836829.html
HappyHorse 1.1刚掀桌子,Seedance 2.5就来了 HappyHorse 1.1刚掀桌子,Seedance 2.5就来了
No comments:
Post a Comment