Riffusion 是一个基于稳定扩散技术的实时音乐和音频生成库。 它通过先进的扩散管道,实现了提示插值与图像条件化的结合,能够将 spectrogram 图像与音频片段进行转换。
Azure AI 语音提供了多种语音相关的功能,如语音转文本、文本转语音、语音分析、语音合成、语音验证等。
Coqui TTS 是 Coqui-ai 团队精心打造的一款基于深度学习的文本转语音项目。 它以其开源性和强大功能在 TTS 领域崭露头角。
海豚配音是功能全面的 AI 配音工具,能将文本转换为逼真、富有情感的语音。 海豚 AI 配音提供超 500 种真人音色和 1000 多种二次元音色,支持 20 多种语言,满足不同用户的需求。
大饼 AI 变声是一款专注于声音领域的 AI 工具,提供实时变声、音色转换和文本转语音等功能。
FineVoice 是一款免费在线 AI 语音生成器和配音工具,支持文本转语音、语音克隆、语音转换等功能,提供多种语言和音色选择,适用于视频配音、播客制作等多种场景。
轻量级语音识别框架,支持离线部署,适合嵌入式设备和低算力场景。
Azure AI 语音提供了多种语音相关的功能,如语音转文本、文本转语音、语音分析、语音合成、语音验证等。