标签: TTS 大模型 | 御青说

TTS 大模型

2025 [7]

[13] ★ 专题分享 | [slides] 基于 ARDM（自回归扩散模型）的语音合成 2025-11-03
[12] ★ 专题分享 | 语音生成的新范式？连续表征的「自回归 × 扩散」建模 2025-09-20
[11] ★ 专题分享 | 小红书 FireRedTTS 系列：从基础合成能力到长对话生成的演进 2025-09-14
[10] 语音合成 | [slides] CosyVoice 1&2：DiffRO 强化学习 2025-08-21
[8] 语音对话 | Kimi-Audio 端到端语音大模型 2025-06-26
[9] 专题分享 | [slides] 重新思考 Tortoise-TTS 范式下的语音合成 2025-06-26
[7] 语音合成 | [slides] MegaTTS3：稀疏对齐思想下的 Flow Matching TTS 2025-04-14

2024 [3]

[6] 语音合成 | [slides] FireRedTTS：小红书的 TTS 实践 2024-09-25
[5] 语音合成 | [slides] CosyVoice：通义语音实验室 TTS 新工作 2024-07-09
[4] 语音合成 | [slides] NaturalSpeech3：离散 Diffusion 视角的 TTS 2024-04-01

2023 [3]

[3] 语音合成 | Mega-TTS 2：基于任意长度 prompt 的零样本复刻 2023-09-16
[2] 语音合成 | Mega-TTS：引入先验偏置的 TTS 方案 2023-08-08
[1] 语音合成 | [slides] Spear TTS：基于 LLM 的分阶段语音合成 2023-06-01