御青说
  • 首页
  • 博客
  • 技术分享
  • 论文追踪
  • 项目
  • 标签
  • 关于
  • 首页
  • 博客
  • 技术分享
  • 论文追踪
  • 项目
  • 标签
  • 关于
🔒

该页面已加密

本页内容仅限授权人员查看,请输入访问密码

本页面仅集中展示当前关键的语音合成能力栈及效果样例,不涉及任何公司的核心技术实现细节。

各项能力均可在公司「小猿 AI / 猿辅导 / 斑马」及学习机系列智能硬件的免费或会员服务中实际体验。

模型能力仍在持续优化中,页面中示例音频大多来自上一季度(2025年底)前的系统评测,不能完全反映最新迭代后的最优效果。

🎨产品音色示例

面向产品落地的定制音色与 IP 音色效果展示

🎓

AI一对一 | 超拟人老师课堂产品展示

AI 一对一私教场景下的完整链路实测。视频录制自真实产品交互界面,完整呈现数学教师与英语教师在教学过程中的语音合成表现,包括讲解节奏、情感变化、口播连贯性等维度。

完整链路实测 数学 + 英语 产品实录 Demo
🧑‍🏫

一对一数学教师音色效果

一对一教学的数学教师定制音色,覆盖赞赏、鼓励、质疑、安慰、俏皮调侃等情绪风格,并支持重读控制,共 20 条示例。

定制音色 SFT+RL Demo
🎤

核心 IP 音色合成效果

「小猿AI」核心 IP 音色在通用问答场景下的合成效果,覆盖百科知识、数学计算、应用题、中文写作、英文写作等场景。

IP 音色 多意图 Demo

⚡ 高阶合成能力

自研模型在高阶合成能力维度上的效果展示与竞品对比

🎭

自然文本描述指令合成效果

通过自然语言指令精确控制语音合成的情感与语气风格,目前能力仍然偏「模板化」,具体涵盖愤怒、焦急、严肃、热情、调侃、抱怨、坚定等数十种语气,共 100 组 Prompt 克隆 + 指令合成样本。

情感风格控制 自然语言描述 Demo
🎭

情感指令合成效果对比

对比带情感指令(Instruct)与不带情感指令(NonInstruct)两种合成方式的效果差异,含 100 组样本与筛选功能。

情感控制 Instruct Demo
🎙️

声音复刻能力多维度展示

基于参考音频实现声音复刻,从情感保持、韵律还原、情感迁移及通用复刻等多个维度进行展示,覆盖中英文场景,小/大参数模型横向对比。

声音复刻 多维度评测 Demo
🎙️

重读控制能力对比

自研模型与 CosyVoice3 在「指定重读/强调」能力上的效果对比,支持中英文场景,含参考音频与合成音频的逐条试听。

vs CosyVoice3 重读控制 Demo

🎯 高难场景定制优化

自研模型在各业务场景下的合成效果展示

📜

中文古诗文合成对比

自研模型与 CosyVoice3 在古诗文合成上的效果对比,涵盖唐诗、宋词、先秦散文、乐府诗等多种体裁,共 50 组对比样本。

vs CosyVoice3 古诗文 Demo
🔢

数学 AI 讲题合成效果

数学 AI 讲题场景下的合成效果,涵盖 LaTeX 公式朗读、分数运算、方程求解、几何面积、概率推导等数学讲解,共 50 条示例。

数学教学 公式朗读 Demo
🔤

英语自然拼读合成效果

自然拼读(Phonics)专项优化后的效果展示,可零成本泛化至任意音色。经业务评测,外部竞品(豆包、Minimax 等)准确性和稳定性均不及自研模型。

自然拼读 DPO Demo
📚

英语教学场景合成效果

英语教学场景下的合成效果,涵盖中英文混合教学(单词、语法、口语)与英语 AI 讲题(听力、阅读、翻译)两大场景,共 50 条示例。

英语教学 中英混合 Demo
© 2019 - 2026    白御青
总字数 178.4k 总访问量 
Exploring the Frontiers of Speech Intelligence
Hexo / Keep