Azure AI 语音提供了多种语音相关的功能,如语音转文本、文本转语音、语音分析、语音合成、语音验证等。
轻量级语音识别框架,支持离线部署,适合嵌入式设备和低算力场景。
Suno是一款基于人工智能的音乐创作平台,允许用户通过输入简单的提示词(如歌词、风格、主题等)生成数字音乐文件。
FunASR 是由阿里巴巴达摩院开源的语音识别工具包,包括在大规模工业语料库上训练的模型,提供语音识别、语音活动检测、标点恢复等多种功能。
海豚配音是功能全面的 AI 配音工具,能将文本转换为逼真、富有情感的语音。 海豚 AI 配音提供超 500 种真人音色和 1000 多种二次元音色,支持 20 多种语言,满足不同用户的需求。
Stability AI 推出的 Stable Audio 是一种基于 稳定扩散技术 的音频生成模型,它能够根据文本提示高效生成高品质的音频内容。
Speechify AI 语音生成器提供 60 多种语言的 200 多种逼真语音,支持语音克隆、情感调节和速度控制,适用于视频、广告、电子学习等多种项目。
轻量级语音识别框架,支持离线部署,适合嵌入式设备和低算力场景。