Riffusion 是一个基于稳定扩散技术的实时音乐和音频生成库。 它通过先进的扩散管道,实现了提示插值与图像条件化的结合,能够将 spectrogram 图像与音频片段进行转换。
Audiocraft 是一个使用深度学习进行音频处理和生成的库,集成了最先进的 EnCodec 音频压缩器/分词器,以及 AudioGen 和 MusicGen 两种 AI 生成模型。
11Labs,正式名称为 ElevenLabs,是 AI 技术领域的先锋力量,特别以其在语音克隆和 文本转语音 解决方案方面的专业知识而闻名。 利用人工智能和深度学习算法的力量,11Labs 使用户能够轻松制作高质量且逼真的 AI 生成配音。
天工 SkyMusic 是一款基于天工 3.0 模型架构的 AI 音乐生成大模型,能够根据歌词、风格和情感生成高质量的双声道立体声歌曲。
Coqui TTS 是 Coqui-ai 团队精心打造的一款基于深度学习的文本转语音项目。 它以其开源性和强大功能在 TTS 领域崭露头角。
大饼 AI 变声是一款专注于声音领域的 AI 工具,提供实时变声、音色转换和文本转语音等功能。
Uberduck 是一个基于人工智能技术的在线 AI 语音合成网站,专注于提供高质量的语音合成服务。
NaturalReader 是一款文本转语音软件,基于 AI 技术将文本文档转换成自然流畅的语音输出。
Reecho睿声是一款专注于 5 秒瞬时语音克隆和超拟真语音合成的创新产品.
海豚配音是功能全面的 AI 配音工具,能将文本转换为逼真、富有情感的语音。 海豚 AI 配音提供超 500 种真人音色和 1000 多种二次元音色,支持 20 多种语言,满足不同用户的需求。
Riffusion 是一个基于稳定扩散技术的实时音乐和音频生成库。 它通过先进的扩散管道,实现了提示插值与图像条件化的结合,能够将 spectrogram 图像与音频片段进行转换。