AI视频生成 Goku
Goku 是香港大学与字节跳动合作开发的视频生成模型,支持文本到视频、图像到视频、文本到图像等多种生成任务。基于 Rectified Flow Transformer 架构,通过多模态训练,Goku能够生成自然互动的广告视频,显著降低制作成本。
Goku 是香港大学与字节跳动合作开发的视频生成模型,支持文本到视频、图像到视频、文本到图像等多种生成任务。基于 Rectified Flow Transformer 架构,通过多模态训练,Goku能够生成自然互动的广告视频,显著降低制作成本。
Sa2VA 是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型,是 SAM2 和 LLaVA 结合而成,能实现对图像和视频的密集、细粒度理解。