image

白御青

Speech Generation Team Leader & Researcher

探索语音合成、语音对话、语音识别等智能语音技术前沿,跟进 LLM 时代下语音大模型的行业进展动态。

-- 技术博客 -- 报告分享
-- 年语音 AI 经验
THU 清华大学 本硕
研究/工作方向
语音合成 (TTS)
LLM + Flow Matching DiT-AR Zero-Shot 声音复刻 Instruct-TTS
Codec / Tokenizer
Semantic/Discrete Tokenizer Neural Audio Codec VAE Continous Tokenizer
语音对话 (Dialog)
Speech-to-Speech LLM Omni-Modal Full-Duplex
语音识别 (ASR)
Streaming E2E 多语种 / 低资源 KWS
语音大数据工程
大规模数据分层体系 预训练数据管线 数据质量评估
后训练 (Post-Training)
RLHF / DPO / GRPO Reward Modeling Entropy/Logits-based RL
工作经历
公司 Y · 语音合成团队负责人
2024.05 — 至今
  • 基于 LLM 和 Flow Matching 的语音合成大模型
  • TTS 大规模数据分层管理体系
  • TTS 预训练 / 继续预训练 / SFT / RLHF
公司 Y · 语音合成算法工程师
2022.03 — 2024.04
  • 中文 / 英文多说话人语音合成
  • 零样本 / 少样本个性化语音合成与语音编辑
公司 B · 语音识别高级算法工程师
2021.11 — 2022.02
  • 地图 & 搜索业务语音识别
  • 流式语音识别 / 语义 VAD
公司 Y · 语音识别算法工程师
2020.07 — 2021.09
  • 纯中文 / 中英混语音识别
  • 儿童领域流式语音识别与优化
公司 H · 语音识别算法实习生
2019.02 — 2020.06
  • 多语种低资源语音识别与关键词检索
  • 呼叫中心电话场景语音识别及后处理
教育经历
🎓
工学学士
2014.08 — 2018.07
📊
统计学辅修
2016.08 — 2018.07
🎓
工程硕士
2018.08 — 2020.08
荣誉奖项
  • 2019 年清华大学媒体大数据认知计算研究中心 学术新秀奖
  • 2019 年 OpenSAT 国际语音评测低资源关键词检索 国际第二名
  • 2019 年 OpenSAT 国际语音评测低资源语音识别 国际第三名
更多荣誉
  • 2016 年清华大学国家奖学金
  • 2015 年清华大学学业优秀奖学金
  • 2015 年全国大学生物理竞赛 A 类二等奖
  • 2014 年清华大学新生二等奖学金
  • 2014 年理科高考总分全省第二名
  • 2013 年全国高中联赛数学省级一等奖、物理省级二等奖、化学省级二等奖