Video Diffusion Models是一个展示使用扩散模型生成图片和视频结果的项目,证明了联合训练图像和视频数据是有效的。
Phenaki,一种基于文本提示进行逼真视频合成的模型,提示可以随时间变化,视频可以长达几分钟。