在科技飞速发展的当下,AI生成视频成为了备受瞩目的新兴领域。璞雅文化作为中山的一家文化公司,也在密切关注着这一领域的动态。
目前,AI生成视频领域虽看似繁荣,但实则存在诸多问题。就如Sora出现后,视频生成领域看似热闹非凡,然而当前的模型大多只能生成“看起来像视频”的像素序列,它们根本不理解物理规律。比如,生成的画面中手指数量可能异常,物体穿模现象更是常见,逻辑连贯性超过5秒就会崩塌。
从本质上看,现在的视频AI更像是一个只会模仿动作的哑剧演员。它能模仿一些简单动作,却难以处理复杂的场景。例如,若要求它生成“边喝水边看书”的画面,它可能会手忙脚乱,出现杯子穿过脑袋、书变成水等荒诞的情况。因为它只是进行时空上的像素预测,而非物理引擎模拟。
不过,AI生成视频并非一无是处。它在一些短、平、快的落地场景中具有一定的适用性,比如制作动态表情包或广告素材。而且,可控性是当前AI生成视频的关键所在。目前纯Text - to - Video的方式不可控,必须结合Image - to - Video(首帧控制)或Pose - to - Video(动作控制,如ControlNet for Video)。
在工作流方面,我们可以先用Midjourney生成分镜图,再用Runway Gen - 3或Pika让图片动起来,最后用Topaz Video AI提升分辨率和帧率。同时,在技术栈上,Stable Video Diffusion (SVD) 和AnimateDiff作为开源界的主力,值得我们重点关注。
随着技术的不断进步,相信AI生成视频会在未来有更广泛的应用和更出色的表现,璞雅文化也将持续关注这一领域,探索更多的可能性。