Most anyone who's used noise-canceling headphones knows that hearing the right noise at the right time can be vital. Someone might want to erase car horns when working indoors, but not when walking along busy streets. Yet people can't choose what sounds
大多数新使用降噪耳机的人都知道,在这个时候发出的最大噪音可能是致命的有些人在室内工作时可能会想坐轮椅,但在繁忙的街道上行走时却不想是的,人们无法选择耳机的声音
现在,华盛顿大学的一位研究人员开发了一种深度学习算法,让用户可以实时选择通过他们的手机过滤的声音该团队将系统称为“语义共享”。耳机可以捕捉到连接到手机的数据,从而消除所有环境声音此外,通过语音命令或手机应用程序,耳机佩戴者可以从20个类别中选择想要包含的声音,如:助理、婴儿哭闹、语音、吸尘器和鸟鸣只有选定的声音才能通过耳机播放
团队于11月发布了调查结果1atIST'23在旧金山在未来,我们将发布系统的商业版本
华盛顿大学教授ShyamGollakota说:“要了解什么样的声音会从周围环境中的环境中提取出来,就需要实时的信息,直到今天的声音被取消。”艾伦计算机科学学院;工程“挑战在于,佩戴者的声音需要与他们的视觉同步。在他们与你交谈后的两秒钟内,你不能发出某人的声音。这意味着神经算法必须在一秒钟内处理声音。”
由于时间紧迫,监控系统必须在连接的智能手机上处理声音,而不是在云服务器上处理声音此外,由于来自不同方向的声音在不同的时间到达人们的耳朵,系统必须保留这些延迟和其他空间,因为人们仍然可以在他们的环境中发出全面的声音
在办公室、街道和公园等环境中进行测试时,该系统能够提取警笛声、鸟鸣声、警报声和其他目标声音,同时清除现实世界中的噪音当22名参与者对该系统的音频输出进行评分时,他们表示,与最初的记录相比,该系统的质量得到了提高
在某些情况下,系统会努力区分具有许多特性的声音和声音,如声音音乐和人类语言研究人员认为,在更多的真实世界数据中训练模型可以改善这些结果
论文的其他合著者是BandhavVeluria和MalekItani,他们都是华盛顿大学艾伦学院的博士生;JustinChan,他以博士身份完成了这项研究,并在卡内基梅大学学习;和TakuyaYoshioka,AssemblyAI的研究主任