连续表征
2026
[2]
- [4] ★ 专题分享 | [slides] VTP:图像生成 Visual Tokenizer 可扩展预训练 2026-04-11
- [3] 专题分享 | [slides] LongCat-AudioDiT 基于 Wav-VAE 的高保真语音合成 2026-03-29
2025
[2]
- [2] ★ 专题分享 | [slides] 基于 ARDM(自回归扩散模型)的语音合成 2025-11-03
- [1] ★ 专题分享 | 语音生成的新范式?连续表征的「自回归 × 扩散」建模 2025-09-20