news 2026/5/12 14:20:21

人工智能应用-机器听觉:3.早期的语音合成器

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
人工智能应用-机器听觉:3.早期的语音合成器

1769 年,匈牙利发明家沃尔夫冈·冯·肯佩伦(Wolfgang von Kempelen)依据人类发声原理制作了一台机械发声器,这是让机器“开口说话”的早期尝试之一。如图所示,这台机械装置的皮质风箱相当于人类的肺,木质空箱内的阀门则模拟了声道。当挤压风箱时,气流冲过阀门进入空箱,可以发出一些类似人声的简单发音。

1939 年, 贝尔实验室的科学家霍默· 达德利

(Homer Dudley)发明了声码器,首次通过电路设计实现了源-滤波模型。它不仅可以对语音信号进行“分析”,即将语音分解为声门信息和声道信息,还可以利用这些信息对语音进行重构。如图30.4所示,操作者通过键盘调节声道参数 h(n),踏板则控制元音的音高,手腕用于切换元音和辅音。选择好这些参数后,机器便可以按照人类发音模型合成语音。声码器的发明为语音合成技术奠定了基础,也成为现代语音信号处理技术的重要起点。

Kempelen 发声器的复现模型

1939 年,贝尔实验室的 VODER 发声器在纽约世界博览会上展出,引起轰动

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/12 13:18:33

【收藏】上下文工程:决定AI应用质量的75%关键因素,提示词仅占10%

上下文工程决定AI应用质量的75%,远超模型选择(15%)和提示词设计(10%)。它包含六大核心组件:提示词技术、查询增强、长期/短期记忆管理、知识库检索和工具智能体。真正的"魔法"在于整个信息流水线:上下文来源、检索筛选格式化、工具…

作者头像 李华
网站建设 2026/5/10 3:54:52

2026年软件测试公众号热度全景:专业洞察与行动指南

软件测试公众号在2026年已成为从业者获取行业动态的核心渠道,热度内容集中于解决实际痛点(如效率瓶颈、安全风险),并以专业深度驱动流量增长。本文基于最新数据,解析三大爆款内容类型,并以“手动验证”为案…

作者头像 李华
网站建设 2026/5/8 22:57:45

好写作AI:论文政策建议不再“假大空”,AI教你写出一针见血的方案!

当你的政策建议部分写得像政府工作报告摘抄,连自己看了都想点“下一页跳过”时——是时候请AI这位“策略军师”出山了。 张明对着论文最后一章“政策建议”发了半小时呆,写出来的句子仿佛是从十年前教科书里穿越来的:“应加强监管…需完善体系…

作者头像 李华
网站建设 2026/5/10 14:57:13

SGMICRO圣邦微 SGM2205-3.3XKC3G/TR SOT-223-3 线性稳压器(LDO)

特性宽工作输入电压范围:2.5V至20V固定输出电压:1.8V、2.5V、3.0V、3.3V、3.6V、4.2V、5.0V和12V可调输出电压范围:1.8V至15V输出电压精度:25C时为1%低压差:800mA时典型值为450mV电流限制和热保护出色的负载和线性瞬态…

作者头像 李华
网站建设 2026/5/1 9:58:54

Infineon英飞凌 IR2085STRPBF SOIC-8 栅极驱动芯片

特性简单的初级侧控制解决方案,可用于48V分布式系统的半桥直流母线转换器,减少元件数量和电路板空间集成50%占空比振荡器和半桥驱动IC于单个SO - 8封装中可编程开关频率,每通道最高可达500kHz具备/- 1A驱动电流能力,针对低电荷MOS…

作者头像 李华
网站建设 2026/5/3 1:56:24

我用的是 Arch BTW”到底算不算吹牛?

在 Linux 圈子里,有一句话几乎已经成了文化符号: “I use Arch BTW.” 它既是炫耀,也是自嘲; 既是身份认同,也是社区玩梗。 但问题来了—— 如果你用的是 EndeavourOS、CachyOS、Manjaro,甚至是装了 Archinstall 的 Arch,那你到底“配不配”说这句话? 这看似是个玩…

作者头像 李华