-
语音对话 | Kimi-Audio 端到端语音大模型
论文题目:Kimi-Audio Technical Report 论文链接:https://arxiv.org/pdf/2504.18425 开源链接:https://github.com/MoonshotAI/Kimi-Audio base 模型:https://huggingface.co/moonshotai/Kimi-Audio-7B Instruct 模型:... -
专题分享 | [slides] 重新思考 Tortoise-TTS 范式下的语音合成
-
语音合成 | [slides] MegaTTS3:稀疏对齐思想下的 Flow Matching TTS
-
语音合成 | [slides] FireRedTTS:小红书的 TTS 实践
-
语音对话 | [slides] Moshi:原生端到端语音对话的新探索
-
语音合成 | [slides] CosyVoice:通义语音实验室 TTS 新工作
-
语音合成 | [slides] NaturalSpeech3:离散 Diffusion 视角的 TTS
-
语音合成 | [slides] MobileSpeech:高效的可用于移动端的 TTS 模型
-
专题分享 | [slides] 基于 LLM 的音频生成方案(二)
-
专题分享 | [slides] 基于 LLM 的音频生成方案(一)