白御青
Speech Generation Team Leader & Researcher
探索语音合成、语音对话、语音识别等智能语音技术前沿,跟进 LLM 时代下语音大模型的行业进展动态。
研究/工作方向
语音合成 (TTS)
Codec / Tokenizer
语音对话 (Dialog)
语音识别 (ASR)
语音大数据工程
后训练 (Post-Training)
工作经历
公司 Y · 语音合成团队负责人
2024.05 — 至今
- 基于 LLM 和 Flow Matching 的语音合成大模型
- TTS 大规模数据分层管理体系
- TTS 预训练 / 继续预训练 / SFT / RLHF
公司 Y · 语音合成算法工程师
2022.03 — 2024.04
- 中文 / 英文多说话人语音合成
- 零样本 / 少样本个性化语音合成与语音编辑
公司 B · 语音识别高级算法工程师
2021.11 — 2022.02
- 地图 & 搜索业务语音识别
- 流式语音识别 / 语义 VAD
公司 Y · 语音识别算法工程师
2020.07 — 2021.09
- 纯中文 / 中英混语音识别
- 儿童领域流式语音识别与优化
公司 H · 语音识别算法实习生
2019.02 — 2020.06
- 多语种低资源语音识别与关键词检索
- 呼叫中心电话场景语音识别及后处理
教育经历
荣誉奖项
- 2019 年清华大学媒体大数据认知计算研究中心 学术新秀奖
- 2019 年 OpenSAT 国际语音评测低资源关键词检索 国际第二名
- 2019 年 OpenSAT 国际语音评测低资源语音识别 国际第三名
更多荣誉
- 2016 年清华大学国家奖学金
- 2015 年清华大学学业优秀奖学金
- 2015 年全国大学生物理竞赛 A 类二等奖
- 2014 年清华大学新生二等奖学金
- 2014 年理科高考总分全省第二名
- 2013 年全国高中联赛数学省级一等奖、物理省级二等奖、化学省级二等奖