Sa2VA - APPMark

AI视频生成

Sa2VA

Sa2VA 是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型，是 SAM2 和 LLaVA 结合而成，能实现对图像和视频的密集、细粒度理解。

链接直达手机查看

快点收藏起来

Sa2VA 是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型，是 SAM2 和 LLaVA 结合而成，能实现对图像和视频的密集、细粒度理解。

相关导航

Open-Sora 是一个致力于高效生成高质量视频的开源项目。该项目由 Colossal-AI 团队开发，旨在通过开源的方式，简化视频生成的复杂性，并为所有人提供一个创新、创造和包容的平台。

魔搭MotionAgent

魔搭 MotionAgent 是由阿里巴巴达摩院旗下魔搭社区（ModelScope）推出的开源一站式视频生成工具，MotionAgent 集成了大语言模型、文本生成图片模型、视频生成模型和音乐生成模型。

Show-1 是一种高效的文本到视频生成模型,它结合了像素级和潜变量级的扩散模型,既能生成与文本高度相关的视频,也能以较低的计算资源要求生成高质量的视频。