Pippo 是 Meta Reality Labs 推出的图像到 视频生成 模型,能从单张照片生成 1K 分辨率的多视角高清人像视频。
包括 Pika 1.0 和 Pika 2.0,这些模型在处理活动主体的真实性方面进行了优化,尽管在复杂行为生成上仍面临挑战。
Runway Gen系列包括 Runway Gen-2 和其后续升级版本 Runway Gen-3,这些模型专注于从文本到视频的转换,展示了在物体运动和场景生成方面的进步。
Luma Ray2 是 Luma AI 推出的最新视频生成模型,Ray2 基于 Luma 新的多模态架构训练后展现出先进功能,该架构的计算能力是 Ray1 的 10 倍。
FastHunyuan 是一种可以提高 HunyuanVideo 模型推理速度的扩散模型,支持多种视频生成任务。
Show-1 是一种高效的文本到视频生成模型,它结合了像素级和潜变量级的扩散模型,既能生成与文本高度相关的视频,也能以较低的计算资源要求生成高质量的视频。
通义万相是阿里云推出的视觉生成大模型,涵盖图像和视频生成。其2.0版本在文生图和文生视频方面进行了重大升级,采用 Diffusion Transformer 架构,提升了模型的灵活性和可控性。
包括 Pika 1.0 和 Pika 2.0,这些模型在处理活动主体的真实性方面进行了优化,尽管在复杂行为生成上仍面临挑战。