通过跨学科的合作与交流,我们能够突破传统思维的边界,开拓新的研究领域。

——院长致词

首页 > 科学研究 > 生活

AI headphones create a 'sound bubble,' quieting all sounds more than a few feet away

本站发布时间:2025-06-22 19:50:25
注:部分名称可能翻译不全,如有问题可联系15163559288@163.com

华盛顿大学研究人员领导的团队开发了一款耳机原型,使听者能够创建此类"声音气泡"。该团队的人工智能算法结合耳机原型,让佩戴者能听到可编程半径为3至6英尺气泡范围内人员的说话声。气泡外的语音和声音平均可降低49分贝(相当于吸尘器与树叶沙沙声之间的声压差),即使远处声音比气泡内更响亮。

研究团队于11月14日在《自然·电子学》发表成果。概念验证设备的代码已开源供后续开发。研究人员正创建初创公司以实现技术商业化。

"人类通过声音感知距离的能力有限,尤其在多声源环境中,"资深作者、保罗·G·艾伦计算机科学与工程学院教授夏姆·戈拉科塔表示,"在嘈杂餐厅等场所,我们聚焦附近人员的能力会受到制约,因此可听设备至今无法实现声音气泡。我们的AI系统能在8毫秒内,直接在听力设备上实时学习室内每个声源的距离并进行处理。"

研究人员采用市售降噪耳机制作原型,在头梁上安装了六个微型麦克风。通过耳机附带的嵌入式计算机,团队神经网络追踪不同声音抵达各麦克风的时间差。系统抑制气泡外声音的同时,会回放并适度放大气泡内声音(因降噪耳机的物理结构会允许部分声音传入)。

"此前智能扬声器系统需将麦克风分散布置于桌面,我们原以为必须保持较大间距才能提取声音距离信息,"戈拉科塔解释道,"但后来我们质疑这个假设:创建'声音气泡'真需要大间距吗?实验证明并非如此。仅靠耳机麦克风就能实时实现,这令人惊喜。"

为训练系统在不同环境创建声音气泡,团队需要真实世界的距离声音数据集(当时尚未存在)。研究人员将耳机置于人体模型头部,通过机械平台旋转头部,同时移动扬声器播放不同距离的噪音。该模型系统与真人用户在22种室内环境(包括办公室和生活空间)中采集了数据。

 

研究确认系统有效的两大因素:首先,佩戴者头部反射声音有助于神经网络区分不同距离声源;其次,人声等含多频率的声音在传播过程中会产生相位差。团队认为其AI算法通过比对各频率相位差来确定声源(如说话者)距离。

苹果AirPods Pro 2等耳机可增强前方人声并降低部分背景噪音,但其原理依赖头部定位和定向增强,而非距离测算。这意味着:无法同时增强多名说话者;转头偏离目标说话者即失效;对目标方向强噪音的降噪效果有限。

当前系统仅在室内环境完成训练(户外纯净音频采集难度较高)。团队下一步致力于将该技术应用于助听器和降噪耳塞,这需要重新设计麦克风布局方案。

其他合著者包括艾伦学院博士生马利克·伊塔尼和陈拓超,微软高级研究员塞菲克·埃米尔·埃斯基梅兹,以及AssemblyAI研究总监良冈卓也。本研究由摩尔发明家学者奖、华盛顿大学科莫申创新缺口基金和美国国家科学基金会资助。

Story Source:

Materialsprovided byUniversity of Washington. Original written by Stefan Milne.Note: Content may be edited for style and length.

Journal Reference:

Tuochao Chen, Malek Itani, Sefik Emre Eskimez, Takuya Yoshioka, Shyamnath Gollakota.Hearable devices with sound bubbles.Nature Electronics, 2024; DOI:10.1038/s41928-024-01276-z

排行榜

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

北前院微信公众号