分类: 技术分享 | 御青说

技术分享

2026 [2]

[24] 专题分享 | 副语言语音数据集开源工作汇总 2026-02-05
[23] 专题分享 | ICASSP 2026 HumDial 类人语音对话挑战赛 2026-01-10

2025 [6]

[22] ★ 专题分享 | [slides] 基于 ARDM（自回归扩散模型）的语音合成 2025-11-03
[21] ★ 专题分享 | 2025年10月，一文梳理国内外八大厂商 TTS 能力 2025-10-22
[20] ★ 专题分享 | 语音生成的新范式？连续表征的「自回归 × 扩散」建模 2025-09-20
[19] ★ 专题分享 | 小红书 FireRedTTS 系列：从基础合成能力到长对话生成的演进 2025-09-14
[17] 语音对话 | Kimi-Audio 端到端语音大模型 2025-06-26
[18] 专题分享 | [slides] 重新思考 Tortoise-TTS 范式下的语音合成 2025-06-26

2023 [6]

[16] ★ 专题分享 | [slides] 基于 LLM 的音频生成方案（二） 2023-11-20
[15] ★ 专题分享 | [slides] 基于 LLM 的音频生成方案（一） 2023-11-13
[14] 专题分享 | GAN 系列之三：最小二乘 GAN 2023-03-23
[13] 专题分享 | GAN 系列之二：GAN 的改进 2023-03-21
[12] 专题分享 | GAN 系列之一：GAN 的基础 2023-03-12
[11] ★ 专题分享 | [slides] 通过文本编辑语音：基于mask的生成式模型 2023-01-12

2022 [4]

[10] 专题分享 | 基于 Adapter 的少样本 TTS 方案 2022-12-22
[9] 专题分享 | [slides] 零/少样本音色克隆（三）：其他方案 2022-11-13
[8] 专题分享 | [slides] 零/少样本音色克隆（二）：常用方案综述 2022-09-15
[7] ★ 专题分享 | [slides] 零/少样本音色克隆（一）：AdaSpeech 系列 2022-05-26

2021 [1]

[6] ★ 专题分享 | [slides] 基于 Lattice 的 ASR 重打分：从 WFST 到 Transformer 2021-07-01

2020 [2]

[5] ★ 专题分享 | [slides] 级联（Hybrid）语音合成概述 2020-09-17
[4] 专题分享 | [slides] 语音识别技术分享(本科/硕士期间工作) 2020-07-20

2019 [3]

[3] 专题分享 | [ICASSP-preprint] 基于 X-vector 的声学模型说话人自适应 2019-12-12
[2] 专题分享 | [OpenSAT Workshop] NIST OpenSAT 2019 THU-EE 系统报告 2019-06-06
[1] 专题分享 | [IALP-论文] 低资源语音识别的语言模型通用优化流程 2019-03-03