御青说
  • 首页
  • 博客
  • 报告
  • 标签
  • 论文
  • 关于
  • 首页
  • 博客
  • 报告
  • 标签
  • 论文
  • 关于
 TTS 大模型
2025 [7]
  • [13] ★ 专题分享 | [slides] 基于 ARDM(自回归扩散模型)的语音合成 2025-11-03
  • [12] ★ 专题分享 | 语音生成的新范式?连续表征的「自回归 × 扩散」建模 2025-09-20
  • [11] ★ 专题分享 | 小红书 FireRedTTS 系列:从基础合成能力到长对话生成的演进 2025-09-14
  • [10] 语音合成 | [slides] CosyVoice 1&2:DiffRO 强化学习 2025-08-21
  • [8] 语音对话 | Kimi-Audio 端到端语音大模型 2025-06-26
  • [9] 专题分享 | [slides] 重新思考 Tortoise-TTS 范式下的语音合成 2025-06-26
  • [7] 语音合成 | [slides] MegaTTS3:稀疏对齐思想下的 Flow Matching TTS 2025-04-14
2024 [3]
  • [6] 语音合成 | [slides] FireRedTTS:小红书的 TTS 实践 2024-09-25
  • [5] 语音合成 | [slides] CosyVoice:通义语音实验室 TTS 新工作 2024-07-09
  • [4] 语音合成 | [slides] NaturalSpeech3:离散 Diffusion 视角的 TTS 2024-04-01
2023 [3]
  • [3] 语音合成 | Mega-TTS 2:基于任意长度 prompt 的零样本复刻 2023-09-16
  • [2] 语音合成 | Mega-TTS:引入先验偏置的 TTS 方案 2023-08-08
  • [1] 语音合成 | [slides] Spear TTS:基于 LLM 的分阶段语音合成 2023-06-01
© 2019 - 2026    白御青
总字数 161.4k 总访问量 
Hexo / Keep