通过跨学科的合作与交流,我们能够突破传统思维的边界,开拓新的研究领域。

——院长致词

首页 > 科学研究 > 商业与工业

变形智能扬声器允许用户对房间的不同区域进行静音

本站发布时间:2023-11-20 15:37:28

在偶然的会面中,人们很容易避免相互交谈有人只是自鸣得意但对大多数人来说,这种能力并不能很容易地记录个人聚会在繁忙的咖啡馆里,有一个按钮可以让桌子安静下来

定位和控制声音的能力——例如,隔离在拥挤房间的特定位置说话的人——对搜索者来说是一个挑战,尤其是在没有摄像头视觉提示的情况下

在华盛顿大学研究人员的带领下,开发了一种形状变化的智能扬声器,该扬声器使用自行部署的微型扬声器来划分扬声器区域,并跟踪位置以找到两个扬声器在AM深度搜索算法的帮助下,即使相邻的人有相似的声音,该系统也可以让用户进行多个电话或同时进行对话就像飞到Roombas一样,每只都有一个直径,它们的手机会自动从边缘部署,然后返回边缘这允许系统在环境中移动并自动设置例如,在会议讨论中,这种系统可能会部署在一个稳定的麦克风上,从而允许更好地控制房间音频

该团队于9月发布了调查结果21英寸自然通讯

“如果我拒绝了他们,而有10个人在附近,我就不会准确地说出他们在什么地方。这对人类的大脑来说非常困难。到目前为止,这对技术来说也是困难的,”华盛顿大学博士生MalekItani说艾伦计算机科学学院;工程“第一次,使用我们称之为‘机器人’的声波群,我们可以追踪多个扬声器的位置,并将第一个扬声器分离。”

以前对机器人加热的搜索需要从头或设备摄像头、投影仪或特殊表面进行UWteam的系统是第一个只使用声音就可以准确地分发耳机的系统

该团队的原型由七个小型机器人组成,这些机器人将自己分散在各种各样的地方从充电器出来后,每个机器人都会发出高频声音,就像在导航一样,使用这个频率和其他传感器来避免障碍物的出现和移动,而不会掉落到桌子上自动部署使机器人能够最大程度地控制自己,允许创建比任何人设置的控制对象由于距离越大,这些机器人之间的距离就越远,这使得人们的差异和定位变得更容易如今的消费者智能扬声器有多个麦克风,但在同一台设备上,它们的音量太低,无法进入系统的静音和活动区域

“如果我有一个麦克风在离我很远的地方,另一个麦克风两英尺远,我的声音会先到达一个‘英尺远’的麦克风。如果其他人离麦克风很近,他们的声音会首先到达这里,”首席作者、华盛顿大学法学院博士生陈拓超说“我们开发了一个神经网络,它可以将延迟时间的信号与每个人的位置分开,并在空间中跟踪他们的位置。因此,你可以让四个人进行两次对话,并在房间中找到语音和位置的任何一个。”

团队测试了办公室、客厅和厨房中的机器人,每组有五个人发言在所有这些环境中,系统可以在1中识别不同的选择6英尺(50厘米),其余90%的时间,没有关于说话者数量的优先信息该系统能够在1中处理3秒钟的音频平均82秒——直播速度更快,但视频通话等实时通信速度较慢

研究人员表示,随着技术的进步,声学集群越来越多地部署在智能家居中,以区分使用智能扬声器的人例如,这可能只会让坐在“活动区”的人通过语音控制电视

研究人员通常会制作可以在流中移动的微型相机,而不是闪烁的旋转设备该团队还调查了在现实世界的多个活动区域、不同区域的人和不同的音频中,这些扬声器是否能正常工作作者写道,目前的研究是向科学游戏技术迈出的另一步,比如《GetSmart》和《Dune》中的“ConofSice”

当然,任何一种与传统科技相比较的技术都会引起对隐私的质疑研究人员认识到潜在的火灾,因此他们包括了以下方面的保护措施:微型手机是有声音的,而不是像其他类似系统那样的非车载摄像头机器人很容易看到,当它们活动时,灯会闪烁与大多数智能扬声器一样,声学集群在音频和私人系统中进行处理,而不是在音频中进行处理尽管有些人的第一个想法是关于监控,但该系统可以用于支持网站,该网站说

“它有可能真正有益于隐私,而不是目前的智能扬声器,”意大利语说道“我可以肯定的是,‘不要’记录口罩周围的任何事情,’两个系统都会在一段时间内产生大量的3英尺长的泡沫。泡沫中的任何东西都不会被记录下来。Oriftwo小组正在彼此交谈,而黑人小组正在进行一次事先准备好的对话,而另一个小组正在记录,一次对话可以在一个区域内进行,两次都保持私人状态。”


来源:

Materials provided by
University of Washington. Original written by Stefan Milne.
注明: Content may be edited for style and length.


参考:

  1. Malek Itani, Tuochao Chen, Takuya Yoshioka, Shyamnath Gollakota.
    Creating speech zones with self-distributing acoustic swarms. Nature Communications, 2023; 14 (1) DOI: 10.1038/s41467-023-40869-8

排行榜

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567