Amazon Polly 是一项完全托管的服务,可按需生成语音,将任何文本转换为音频流。 使用深度学习技术转换文章、网页、PDF 文档和其他文本转语音 (TTS)。
一个生成个性化背景音乐(BGM)的工具,适用于视频、直播等场景。
Stability AI 推出的 Stable Audio 是一种基于 稳定扩散技术 的音频生成模型,它能够根据文本提示高效生成高品质的音频内容。
PaddleSpeech 是百度飞桨推出的一款开源语音工具包,旨在提供一站式的语音处理解决方案。
Uberduck 是一个基于人工智能技术的在线 AI 语音合成网站,专注于提供高质量的语音合成服务。
由 OpenAI 推出的多语言语音识别模型,擅长高精度转写和翻译,适合语音转文本、会议记录等场景。
Google Cloud Text-to-Speech API 使开发人员能够借助超过 100 种语音合成自然语音,支持多种语言和变体。
一个生成个性化背景音乐(BGM)的工具,适用于视频、直播等场景。