TTS 大模型
2025
[7]
- [13] ★ 专题分享 | [slides] 基于 ARDM(自回归扩散模型)的语音合成 2025-11-03
- [12] ★ 专题分享 | 语音生成的新范式?连续表征的「自回归 × 扩散」建模 2025-09-20
- [11] ★ 专题分享 | 小红书 FireRedTTS 系列:从基础合成能力到长对话生成的演进 2025-09-14
- [10] 语音合成 | [slides] CosyVoice 1&2:DiffRO 强化学习 2025-08-21
- [8] 语音对话 | Kimi-Audio 端到端语音大模型 2025-06-26
- [9] 专题分享 | [slides] 重新思考 Tortoise-TTS 范式下的语音合成 2025-06-26
- [7] 语音合成 | [slides] MegaTTS3:稀疏对齐思想下的 Flow Matching TTS 2025-04-14
2024
[3]
- [6] 语音合成 | [slides] FireRedTTS:小红书的 TTS 实践 2024-09-25
- [5] 语音合成 | [slides] CosyVoice:通义语音实验室 TTS 新工作 2024-07-09
- [4] 语音合成 | [slides] NaturalSpeech3:离散 Diffusion 视角的 TTS 2024-04-01
2023
[3]
- [3] 语音合成 | Mega-TTS 2:基于任意长度 prompt 的零样本复刻 2023-09-16
- [2] 语音合成 | Mega-TTS:引入先验偏置的 TTS 方案 2023-08-08
- [1] 语音合成 | [slides] Spear TTS:基于 LLM 的分阶段语音合成 2023-06-01