Wingman Studio 让达人和导游轻松制作和销售语音导览,通过 Wingman 城市指南应用,用户可以探索城市。
PaddleSpeech 是百度飞桨推出的一款开源语音工具包,旨在提供一站式的语音处理解决方案。
Amazon Polly 是一项完全托管的服务,可按需生成语音,将任何文本转换为音频流。 使用深度学习技术转换文章、网页、PDF 文档和其他文本转语音 (TTS)。
Stability AI 推出的 Stable Audio 是一种基于 稳定扩散技术 的音频生成模型,它能够根据文本提示高效生成高品质的音频内容。
Speechify AI 语音生成器提供 60 多种语言的 200 多种逼真语音,支持语音克隆、情感调节和速度控制,适用于视频、广告、电子学习等多种项目。
Riffusion 是一个基于稳定扩散技术的实时音乐和音频生成库。 它通过先进的扩散管道,实现了提示插值与图像条件化的结合,能够将 spectrogram 图像与音频片段进行转换。
天工 SkyMusic 是一款基于天工 3.0 模型架构的 AI 音乐生成大模型,能够根据歌词、风格和情感生成高质量的双声道立体声歌曲。
PaddleSpeech 是百度飞桨推出的一款开源语音工具包,旨在提供一站式的语音处理解决方案。