御青说

语音对话 | Kimi-Audio 端到端语音大模型

论文题目：Kimi-Audio Technical Report 论文链接：https://arxiv.org/pdf/2504.18425 开源链接：https://github.com/MoonshotAI/Kimi-Audio base 模型：https://huggingface.co/moonshotai/Kimi-Audio-7B Instruct 模型：...
2025-06-26
- 技术分享
- 语音合成
- | TTS 大模型
阅读全文
专题分享 | [slides] 重新思考 Tortoise-TTS 范式下的语音合成
2025-06-26
- 技术分享
- 语音合成
- | TTS 大模型
阅读全文
语音合成 | [slides] MegaTTS3：稀疏对齐思想下的 Flow Matching TTS
2025-04-14
- 论文笔记
- 语音合成
- | TTS 大模型
阅读全文
语音合成 | [slides] FireRedTTS：小红书的 TTS 实践
2024-09-25
- 论文笔记
- 语音合成
- | 语音 tokenizer
- | TTS 大模型
阅读全文
语音对话 | [slides] Moshi：原生端到端语音对话的新探索
2024-09-23
- 论文笔记
- 语音对话
- | 全双工
阅读全文
语音合成 | [slides] CosyVoice：通义语音实验室 TTS 新工作
2024-07-09
- 论文笔记
- 语音合成
- | 语音 tokenizer
- | TTS 大模型
阅读全文
语音合成 | [slides] NaturalSpeech3：离散 Diffusion 视角的 TTS
2024-04-01
- 论文笔记
- 语音合成
- | 语音 tokenizer
- | TTS 大模型
阅读全文
语音合成 | [slides] MobileSpeech：高效的可用于移动端的 TTS 模型
2024-03-06
- 论文笔记
- 语音合成
阅读全文
专题分享 | [slides] 基于 LLM 的音频生成方案（二）
2023-11-20
- 技术分享
- 语音合成
阅读全文
专题分享 | [slides] 基于 LLM 的音频生成方案（一）
2023-11-13
- 技术分享
- 语音合成
阅读全文

上一页下一页