技术分享
2026
[2]
- [24] 专题分享 | 副语言语音数据集开源工作汇总 2026-02-05
- [23] 专题分享 | ICASSP 2026 HumDial 类人语音对话挑战赛 2026-01-10
2025
[6]
- [22] ★ 专题分享 | [slides] 基于 ARDM(自回归扩散模型)的语音合成 2025-11-03
- [21] ★ 专题分享 | 2025年10月,一文梳理国内外八大厂商 TTS 能力 2025-10-22
- [20] ★ 专题分享 | 语音生成的新范式?连续表征的「自回归 × 扩散」建模 2025-09-20
- [19] ★ 专题分享 | 小红书 FireRedTTS 系列:从基础合成能力到长对话生成的演进 2025-09-14
- [17] 语音对话 | Kimi-Audio 端到端语音大模型 2025-06-26
- [18] 专题分享 | [slides] 重新思考 Tortoise-TTS 范式下的语音合成 2025-06-26
2023
[6]
- [16] ★ 专题分享 | [slides] 基于 LLM 的音频生成方案(二) 2023-11-20
- [15] ★ 专题分享 | [slides] 基于 LLM 的音频生成方案(一) 2023-11-13
- [14] 专题分享 | GAN 系列之三:最小二乘 GAN 2023-03-23
- [13] 专题分享 | GAN 系列之二:GAN 的改进 2023-03-21
- [12] 专题分享 | GAN 系列之一:GAN 的基础 2023-03-12
- [11] ★ 专题分享 | [slides] 通过文本编辑语音:基于mask的生成式模型 2023-01-12
2022
[4]
- [10] 专题分享 | 基于 Adapter 的少样本 TTS 方案 2022-12-22
- [9] 专题分享 | [slides] 零/少样本音色克隆(三):其他方案 2022-11-13
- [8] 专题分享 | [slides] 零/少样本音色克隆(二):常用方案综述 2022-09-15
- [7] ★ 专题分享 | [slides] 零/少样本音色克隆(一):AdaSpeech 系列 2022-05-26
2021
[1]
- [6] ★ 专题分享 | [slides] 基于 Lattice 的 ASR 重打分:从 WFST 到 Transformer 2021-07-01
2020
[2]
- [5] ★ 专题分享 | [slides] 级联(Hybrid)语音合成概述 2020-09-17
- [4] 专题分享 | [slides] 语音识别技术分享(本科/硕士期间工作) 2020-07-20
2019
[3]
- [3] 专题分享 | [ICASSP-preprint] 基于 X-vector 的声学模型说话人自适应 2019-12-12
- [2] 专题分享 | [OpenSAT Workshop] NIST OpenSAT 2019 THU-EE 系统报告 2019-06-06
- [1] 专题分享 | [IALP-论文] 低资源语音识别的语言模型通用优化流程 2019-03-03