知更鸟的博客
  • 首页
  • 归档
  • 报告
  • 标签
  • 论文
  • 关于
  • 首页
  • 归档
  • 报告
  • 标签
  • 论文
  • 关于
语音合成 (37) 声码器 (9) 语音识别 (8) 音频生成 (6) 生成模型 (3) 语音对话 (3) 语音编辑 (2) 语音 tokenizer (2) 语音表征 (1) 音乐生成 (1) 语音数据 (1) TTS 大模型 (1) 全双工 (1) 强化学习 (1)

热门标签动态

语音合成 37篇

  • 社区交流 | 语音模型从设计到使用-通义百聆新年交流会 2026-02-05
  • 技术思考 | 端到端语音交互在教育场景落地的思考 2026-01-15
  • 专题分享 | [slides] 基于 ARDM(自回归扩散模型)的语音合成 2025-11-03

声码器 9篇

  • 专题分享 | GAN 系列之三:最小二乘 GAN 2023-03-23
  • 专题分享 | GAN 系列之二:GAN 的改进 2023-03-21
  • 专题分享 | GAN 系列之一:GAN 的基础 2023-03-12

语音识别 8篇

  • 社区交流 | 语音模型从设计到使用-通义百聆新年交流会 2026-02-05
  • 技术思考 | 端到端语音交互在教育场景落地的思考 2026-01-15
  • 技术思考 | 2023 年开篇:智能语音指南 2023-01-01

音频生成 6篇

  • 语音合成 | Mega-TTS:引入先验偏置的 TTS 方案 2023-08-08
  • 音频生成 | AudioLM:基于语言模型的音频建模 2023-05-20
  • 专题分享 | 基于 Adapter 的少样本 TTS 方案 2022-12-22

生成模型 3篇

  • 专题分享 | GAN 系列之三:最小二乘 GAN 2023-03-23
  • 专题分享 | GAN 系列之二:GAN 的改进 2023-03-21
  • 专题分享 | GAN 系列之一:GAN 的基础 2023-03-12

语音对话 3篇

  • 社区交流 | 语音模型从设计到使用-通义百聆新年交流会 2026-02-05
  • 技术思考 | 端到端语音交互在教育场景落地的思考 2026-01-15
  • 语音对话 | [slides] Moshi:原生端到端语音对话的新探索 2024-09-23
© 2020 - 2026    知更鸟
总字数 70.5k
由 Hexo 驱动 | 主题 Keep v3.6.1