轻量级语音识别框架,支持离线部署,适合嵌入式设备和低算力场景。
PaddleSpeech 是百度飞桨推出的一款开源语音工具包,旨在提供一站式的语音处理解决方案。
FunASR 是由阿里巴巴达摩院开源的语音识别工具包,包括在大规模工业语料库上训练的模型,提供语音识别、语音活动检测、标点恢复等多种功能。
由 OpenAI 推出的多语言语音识别模型,擅长高精度转写和翻译,适合语音转文本、会议记录等场景。
网易天音是一款由网易推出的 AI 音乐创作平台,利用AI技术帮助用户快速生成词曲编唱作品,降低音乐创作门槛。
Beatoven.ai 是 AI 音乐生成平台,旨在为视频、播客和游戏制作者提供版权免费的背景音乐。
Stability AI 推出的 Stable Audio 是一种基于 稳定扩散技术 的音频生成模型,它能够根据文本提示高效生成高品质的音频内容。
一个生成个性化背景音乐(BGM)的工具,适用于视频、直播等场景。
Udio 是由前谷歌 DeepMind 研究员创建的创新型 AI 音乐生成器。
Magenta 是由 google 组织的一个项目,专门进行基于机器学习的人工智能艺术方面的研究,包括自动作曲、音频生成、图画生成等方面。
轻量级语音识别框架,支持离线部署,适合嵌入式设备和低算力场景。