APPMARK 是快速找到最新 AI（Artificial Intelligence, 人工智能）应用的一站式导航平台，我们按照模型平台、提示词、写作、办公、对话聊天、图像、视频、设计、语音、编程、开发平台、法律助手、学习资源等进行分类导航和索引，并保持更新，最短时间内找到需要的AI应用。

AI音频音频生成与处理

Audiocraft

Audiocraft 是一个使用深度学习进行音频处理和生成的库，集成了最先进的 EnCodec 音频压缩器/分词器，以及 AudioGen 和 MusicGen 两种 AI 生成模型。

链接直达手机查看

Audiocraft 是一个使用深度学习进行音频处理和生成的库，集成了最先进的 EnCodec 音频压缩器/分词器，以及 AudioGen 和 MusicGen 两种 AI 生成模型。

FunASR 是由阿里巴巴达摩院开源的语音识别工具包，包括在大规模工业语料库上训练的模型，提供语音识别、语音活动检测、标点恢复等多种功能。

VALL-E 是微软研究院开发的一种用于文本到语音合成（TTS）的语言建模方法。它通过从现成的神经音频编解码模型中派生出的离散代码来训练神经编解码语言模型，并把TTS视为一种条件性语言建模任务，而不是像以往工作那样作为连续信号回归问题处理。