APPMARK 是快速找到最新 AI（Artificial Intelligence, 人工智能）应用的一站式导航平台，我们按照模型平台、提示词、写作、办公、对话聊天、图像、视频、设计、语音、编程、开发平台、法律助手、学习资源等进行分类导航和索引，并保持更新，最短时间内找到需要的AI应用。

AI音频音频生成与处理

sherpa-ncnn

轻量级语音识别框架，支持离线部署，适合嵌入式设备和低算力场景。

链接直达手机查看

轻量级语音识别框架，支持离线部署，适合嵌入式设备和低算力场景。

Murf AI 是一个先进的文本转语音平台，利用人工智能生成类似人类的配音。它提供超过 120 种 AI 声音，涵盖 20 多种语言和口音，使用户能够为广泛的应用创建专业质量的音频内容，还能选择不同的声音模板直接生成视频字幕。

VITS 是一种高表现力语音合成模型，结合了变分推理、标准化流和对抗训练。它是一个完全端到端的TTS模型，使用预先训练好的语音编码器将文本转化为语音，并且是直接从文本到语音波形的转换，无需额外的中间步骤或特征提取。

Audiocraft 是一个使用深度学习进行音频处理和生成的库，集成了最先进的 EnCodec 音频压缩器/分词器，以及 AudioGen 和 MusicGen 两种 AI 生成模型。