APPMARK 是快速找到最新 AI（Artificial Intelligence, 人工智能）应用的一站式导航平台，我们按照模型平台、提示词、写作、办公、对话聊天、图像、视频、设计、语音、编程、开发平台、法律助手、学习资源等进行分类导航和索引，并保持更新，最短时间内找到需要的AI应用。

视觉与图像生成

PixArt-α

PixArt-α 是由华为诺亚方舟实验室联合大连理工大学、香港大学、香港科技大学等多家学术和工业界机构共同研发的一种高效文本到图像生成模型。

链接直达手机查看

PixArt-α是由华为诺亚方舟实验室联合大连理工大学、香港大学、香港科技大学等多家学术和工业界机构共同研发的一种高效文本到图像生成模型。该模型旨在以较低的成本和环境足迹快速训练出能够生成高质量、商业级别的图像的扩散变压器。

Infinity 是字节跳动推出的基于位级自回归建模的视觉生成模型，能根据语言指令生成高分辨率、逼真的图像。Infinity 通过无限词汇量的标记器、分类器和位自纠正机制，显著提升图像生成的细节和质量。

Kandinsky 3.0 是指由俄罗斯 AI Forever 研究团队提出的一种基于潜在扩散的大规模文本到图像生成模型，其目的是提高图像生成的质量和真实性。

ControlNet 不是独立的图像生成模型。相反，它是一个功能强大的附加组件，可与其他模型（如 Stable Diffusion）配合使用。它让你可以对生成的图像的结构和组成进行令人难以置信的控制。

DreamBooth 是一种用于个性化文生图的模型技术。它允许用户通过上传少量特定对象的照片并赋予这些对象唯一的标识符来进行自定义图像生成。

通义万相是阿里云推出的视觉生成大模型，涵盖图像和视频生成。其2.0版本在文生图和文生视频方面进行了重大升级，采用 Diffusion Transformer 架构，提升了模型的灵活性和可控性。