白御青

Speech Generation Team Leader & Researcher

探索语音合成、语音对话、语音识别等智能语音技术前沿，跟进 LLM 时代下语音大模型的行业进展动态。

charlesliucn@126.com github.com/charlesliucn zhihu.com/carpicorn

-- 技术博客 -- 报告分享

-- 年语音 AI 经验

THU 清华大学本硕

研究/工作方向

语音合成 (TTS)

LLM + Flow Matching DiT-AR Zero-Shot 声音复刻 Instruct-TTS

Codec / Tokenizer

Semantic/Discrete Tokenizer Neural Audio Codec VAE Continous Tokenizer

语音对话 (Dialog)

Speech-to-Speech LLM Omni-Modal Full-Duplex

语音识别 (ASR)

Streaming E2E 多语种 / 低资源 KWS

语音大数据工程

大规模数据分层体系预训练数据管线数据质量评估

后训练 (Post-Training)

RLHF / DPO / GRPO Reward Modeling Entropy/Logits-based RL

工作经历

公司 Y · 语音合成团队负责人

2024.05 — 至今

基于 LLM 和 Flow Matching 的语音合成大模型
TTS 大规模数据分层管理体系
TTS 预训练 / 继续预训练 / SFT / RLHF

公司 Y · 语音合成算法工程师

2022.03 — 2024.04

中文 / 英文多说话人语音合成
零样本 / 少样本个性化语音合成与语音编辑

公司 B · 语音识别高级算法工程师

2021.11 — 2022.02

地图 & 搜索业务语音识别
流式语音识别 / 语义 VAD

公司 Y · 语音识别算法工程师

2020.07 — 2021.09

纯中文 / 中英混语音识别
儿童领域流式语音识别与优化

公司 H · 语音识别算法实习生

2019.02 — 2020.06

多语种低资源语音识别与关键词检索
呼叫中心电话场景语音识别及后处理

教育经历

🎓

工学学士

清华大学电子工程系

2014.08 — 2018.07

📊

统计学辅修

清华大学统计学研究中心（统计与数据科学系）

2016.08 — 2018.07

🎓

工程硕士

清华大学电子工程系

2018.08 — 2020.08

荣誉奖项

2019 年清华大学媒体大数据认知计算研究中心学术新秀奖
2019 年 OpenSAT 国际语音评测低资源关键词检索国际第二名
2019 年 OpenSAT 国际语音评测低资源语音识别国际第三名

更多荣誉

2016 年清华大学国家奖学金
2015 年清华大学学业优秀奖学金
2015 年全国大学生物理竞赛 A 类二等奖
2014 年清华大学新生二等奖学金
2014 年理科高考总分全省第二名
2013 年全国高中联赛数学省级一等奖、物理省级二等奖、化学省级二等奖