FunASR 是由阿里巴巴达摩院开源的语音识别工具包,包括在大规模工业语料库上训练的模型,提供语音识别、语音活动检测、标点恢复等多种功能。
Suno是一款基于人工智能的音乐创作平台,允许用户通过输入简单的提示词(如歌词、风格、主题等)生成数字音乐文件。
海豚配音是功能全面的 AI 配音工具,能将文本转换为逼真、富有情感的语音。 海豚 AI 配音提供超 500 种真人音色和 1000 多种二次元音色,支持 20 多种语言,满足不同用户的需求。
Magenta 是由 google 组织的一个项目,专门进行基于机器学习的人工智能艺术方面的研究,包括自动作曲、音频生成、图画生成等方面。
由 OpenAI 推出的多语言语音识别模型,擅长高精度转写和翻译,适合语音转文本、会议记录等场景。
一个生成个性化背景音乐(BGM)的工具,适用于视频、直播等场景。
Azure AI 语音提供了多种语音相关的功能,如语音转文本、文本转语音、语音分析、语音合成、语音验证等。
Suno是一款基于人工智能的音乐创作平台,允许用户通过输入简单的提示词(如歌词、风格、主题等)生成数字音乐文件。