免费🎵 无需注册

AI 播客生成器

由微软 VibeVoice 驱动。超越机械化旁白,轻松创建多说话人播客、引人入胜的有声书和长篇叙述,使用我们免费的AI 语音工具。体验前所未有的高质量、自然流畅的对话音频。

💝 注册用户可享加速通道!

立即开始创建富有表现力的 AI 语音

体验微软 VibeVoice 技术的强大力量。

强大的 AI 语音生成器,完全免费

这款文本转语音工具专为追求质量和灵活性的创作者而设计。

富有表现力的自然语音

生成具有真实语调和情感的高质量音频。非常适合任何需要真实 AI 语音的项目。

多说话人和长篇音频

通过单个提示轻松创建多说话人对话音频。非常适合播客和长篇音频叙述。

免费在线 TTS

基于微软Vibevoice模型构建,我们免费提供这个强大的 TTS 工具。

两种模型选择

选择 VibeVoice 1.5B 追求速度,或选择 7B 追求最高质量。两种模型都能提供卓越的效果。

跨语言支持

支持中文英文,在保持说话人身份的同时无缝切换语言,非常适合多语言内容创作。

无需注册

无需注册登录,立即开始使用我们的 AI播客 语音生成器。

placeholder hero

由微软 VibeVoice 模型驱动

了解使这个 AI 语音生成器成为可能的突破性开源技术。

  • 先进架构
    VibeVoice 采用 VALL-E 风格架构,将 TTS 视为语言建模任务,生成异常自然流畅的语音。
  • 零样本能力
    该模型的关键创新是其"上下文学习"能力,能够从短音频提示合成个性化语音。
  • 开源基础
    基于微软的开源模型构建,让每个人都能使用高质量的 AI 语音技术。
音频示例

聆听差异

聆听由 VibeVoice TTS 模型生成的高质量音频。

自发情感

生成真正富有表现力的语音,捕捉自发、未经脚本的情感细节。非常适合动态内容创作。

带背景音乐的播客

展示了从包含背景噪音的提示中生成清晰语音的鲁棒性,非常适合播客和多媒体内容。

跨语言合成

在保持说话人声音特征的同时,无缝地从中文切换到英文,适用于多语言应用。

优势

为什么选择 VibeVoice

体验下一代 AI 语音技术,拥有无与伦比的质量和可访问性。

基于微软 VibeVoice 模型构建,我们的服务完全免费

完全免费
多说话人对话
富有表现力的自然质量
常见问题

常见问题

还有其他问题?加入我们的 Discord 社区。

1

我应该如何为多角色(多人对话)设置文本格式?

对于单人旁白,直接粘贴文本即可。如果想为多人对话分配不同的声音,请在每一行的开头使用 Speaker[序号] : 的格式(序号是从0开始),我们的系统会自动为您匹配所选的声音。

2

VibeVoice 1.5B 和 7B 有什么区别?

主要技术差异在于模型规模,这在计算效率和音频保真度之间产生了明显的权衡。VibeVoice 1.5B 针对速度进行了优化,具有出色的 MOS 4.3 ± 0.1 和约 0.2 的 RTF,非常适合日常使用。VibeVoice 7B 达到了最先进的 MOS 4.5 ± 0.1,保真度更高,但需要更多计算资源(RTF 约 0.8)。

3

这个文本转语音服务真的免费吗?

是的,绝对免费。我们的使命是让每个人都能使用高质量的文本转语音技术。这是一个免费的 TTS 服务,通过利用开源的微软 VibeVoice 模型和高效的云基础设施实现。

4

VibeVoice 的 AI 语音有什么不同?

与许多听起来机械化的 TTS 工具不同,VibeVoice 擅长创建富有表现力的语音输出。它理解上下文以产生自然流畅的语调,非常适合对话音频、播客和需要情感表达的视频旁白。

5

我可以将生成的音频用于商业用途吗?

可以。底层的微软 VibeVoice 模型在宽松的 MIT 许可证下发布。这意味着您使用我们的 AI 语音生成器生成的任何音频都归您所有,可用于个人和商业项目,无需版税。

6

这个 TTS 工具最适合什么类型的内容?

这个在线文本转语音服务非常适合广泛的应用,包括 YouTube 视频、播客、在线学习课程、有声书以及任何需要从文本生成高质量音频的其他项目。其处理长篇音频的能力使其对大型项目特别强大。