Goku - APPMark

Goku

AI视频生成

Goku

Goku 是香港大学与字节跳动合作开发的视频生成模型，支持文本到视频、图像到视频、文本到图像等多种生成任务。基于 Rectified Flow Transformer 架构，通过多模态训练，Goku能够生成自然互动的广告视频，显著降低制作成本。

链接直达手机查看

快点收藏起来

Goku 是香港大学与字节跳动合作开发的视频生成模型，支持文本到视频、图像到视频、文本到图像等多种生成任务。基于 Rectified Flow Transformer 架构，通过多模态训练，Goku能够生成自然互动的广告视频，显著降低制作成本。

相关导航

Sa2VA 是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型，是 SAM2 和 LLaVA 结合而成，能实现对图像和视频的密集、细粒度理解。

Stable Video Diffusion

Stable Video Diffusion 是 Stability AI 发布的一种开源潜在扩散模型，支持文本生成视频和图像生成视频以及物体从单一视角到多视角的 3D 合成。