Kandinsky 3.0 是指由俄罗斯 AI Forever 研究团队提出的一种基于潜在扩散的大规模文本到图像生成模型,其目的是提高图像生成的质量和真实性。
CM3Leon 是一种多模态语言模型,擅长生成和填充文本和图像。它是首个采用纯文本语言模型训练方法的多模态模型,包括大规模检索增强预训练和多任务监督微调阶段。
Flux.1 是最新和最强大的 AI 图像生成模型之一,它使用一种称为潜在扩散模型的高级架构。Flux.1 最受欢迎的版本包括 Flux.1 Pro、Flux.1 Dev 和 Flux.1 Schnell,作为 Midjourney 和 DALLE3 模型竞品,尤其是在比较图像质量和细节时体验更好。
Stable Diffusion 于 2022 年发布,是开启当前 AI 艺术革命的模型。Stable Diffusion是一个开源项目(https://github.com/Stability-AI/stablediffusion),得益于庞大的开发人员和艺术家社区,它不断发展。Stable Diffusion 有许多版本,每个版本的优势略有不同。
PixArt-α 是由华为诺亚方舟实验室联合大连理工大学、香港大学、香港科技大学等多家学术和工业界机构共同研发的一种高效文本到图像生成模型。
DeepFloydIF 是 Stability AI 推出的一款强大的文本到图像模型,基于 T5-XXL 语言模型,能精确生成图像并理解文本提示。 模型采用级联像素扩散方法,在 COCO 数据集上表现优越,具有高度写真性和文本集成能力。
Janus Pro 7B 是 DeepSeek 的开创性 AI 模型,将文本和图像能力结合在一个强大的系统中。基于 DeepSeek-LLM-7b-base,它具有先进的视觉编码,支持高达 384x384 的高分辨率图像处理。
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 *
显示名称 *
邮箱 *
网站
在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。
Δ
CM3Leon 是一种多模态语言模型,擅长生成和填充文本和图像。它是首个采用纯文本语言模型训练方法的多模态模型,包括大规模检索增强预训练和多任务监督微调阶段。