APPMARK 是快速找到最新 AI（Artificial Intelligence, 人工智能）应用的一站式导航平台，我们按照模型平台、提示词、写作、办公、对话聊天、图像、视频、设计、语音、编程、开发平台、法律助手、学习资源等进行分类导航和索引，并保持更新，最短时间内找到需要的AI应用。

视觉与图像生成

Kandinsky-3

Kandinsky 3.0 是指由俄罗斯 AI Forever 研究团队提出的一种基于潜在扩散的大规模文本到图像生成模型，其目的是提高图像生成的质量和真实性。

链接直达手机查看

Kandinsky 3.0 是指由俄罗斯 AI Forever 研究团队提出的一种基于潜在扩散的大规模文本到图像生成模型，其目的是提高图像生成的质量和真实性。

相关导航

CM3Leon

CM3Leon 是一种多模态语言模型，擅长生成和填充文本和图像。它是首个采用纯文本语言模型训练方法的多模态模型，包括大规模检索增强预训练和多任务监督微调阶段。

Flux.1

Flux.1 是最新和最强大的 AI 图像生成模型之一，它使用一种称为潜在扩散模型的高级架构。Flux.1 最受欢迎的版本包括 Flux.1 Pro、Flux.1 Dev 和 Flux.1 Schnell，作为 Midjourney 和 DALLE3 模型竞品，尤其是在比较图像质量和细节时体验更好。

Stable Diffusion

Stable Diffusion 于 2022 年发布，是开启当前 AI 艺术革命的模型。Stable Diffusion是一个开源项目（https://github.com/Stability-AI/stablediffusion），得益于庞大的开发人员和艺术家社区，它不断发展。Stable Diffusion 有许多版本，每个版本的优势略有不同。

PixArt-α

PixArt-α 是由华为诺亚方舟实验室联合大连理工大学、香港大学、香港科技大学等多家学术和工业界机构共同研发的一种高效文本到图像生成模型。

DeepFloyd IF

DeepFloydIF 是 Stability AI 推出的一款强大的文本到图像模型，基于 T5-XXL 语言模型，能精确生成图像并理解文本提示。模型采用级联像素扩散方法，在 COCO 数据集上表现优越，具有高度写真性和文本集成能力。

Janus Pro 7B

Janus Pro 7B 是 DeepSeek 的开创性 AI 模型，将文本和图像能力结合在一个强大的系统中。基于 DeepSeek-LLM-7b-base，它具有先进的视觉编码，支持高达 384x384 的高分辨率图像处理。

相关导航

发表回复 取消回复

发表回复取消回复