御青说
  • 首页
  • 博客
  • 报告
  • 标签
  • 论文
  • 关于
  • 首页
  • 博客
  • 报告
  • 标签
  • 论文
  • 关于
  • 语音对话 | Kimi-Audio 端到端语音大模型

    论文题目:Kimi-Audio Technical Report 论文链接:https://arxiv.org/pdf/2504.18425 开源链接:https://github.com/MoonshotAI/Kimi-Audio base 模型:https://huggingface.co/moonshotai/Kimi-Audio-7B Instruct 模型:...
      2025-06-26  
    • 技术分享 
     
    • 语音合成 
    • | TTS 大模型 
    阅读全文 
  • 专题分享 | [slides] 重新思考 Tortoise-TTS 范式下的语音合成

      2025-06-26  
    • 技术分享 
     
    • 语音合成 
    • | TTS 大模型 
    阅读全文 
  • 语音合成 | [slides] MegaTTS3:稀疏对齐思想下的 Flow Matching TTS

      2025-04-14  
    • 论文笔记 
     
    • 语音合成 
    • | TTS 大模型 
    阅读全文 
  • 语音合成 | [slides] FireRedTTS:小红书的 TTS 实践

      2024-09-25  
    • 论文笔记 
     
    • 语音合成 
    • | 语音 tokenizer 
    • | TTS 大模型 
    阅读全文 
  • 语音对话 | [slides] Moshi:原生端到端语音对话的新探索

      2024-09-23  
    • 论文笔记 
     
    • 语音对话 
    • | 全双工 
    阅读全文 
  • 语音合成 | [slides] CosyVoice:通义语音实验室 TTS 新工作

      2024-07-09  
    • 论文笔记 
     
    • 语音合成 
    • | 语音 tokenizer 
    • | TTS 大模型 
    阅读全文 
  • 语音合成 | [slides] NaturalSpeech3:离散 Diffusion 视角的 TTS

      2024-04-01  
    • 论文笔记 
     
    • 语音合成 
    • | 语音 tokenizer 
    • | TTS 大模型 
    阅读全文 
  • 语音合成 | [slides] MobileSpeech:高效的可用于移动端的 TTS 模型

      2024-03-06  
    • 论文笔记 
     
    • 语音合成 
    阅读全文 
  • 专题分享 | [slides] 基于 LLM 的音频生成方案(二)

      2023-11-20  
    • 技术分享 
     
    • 语音合成 
    阅读全文 
  • 专题分享 | [slides] 基于 LLM 的音频生成方案(一)

      2023-11-13  
    • 技术分享 
     
    • 语音合成 
    阅读全文 
上一页 下一页
© 2019 - 2026    白御青
总字数 161.4k 总访问量 
Hexo / Keep