通过跨学科的合作与交流,我们能够突破传统思维的边界,开拓新的研究领域。

——院长致词

首页 > 科学研究 > 基础科学

光学发明反映了人眼的图像处理能力

本站发布时间:2024-02-18 16:25:18

在一个寒冷晴朗的日子里,你开车行驶在乡村公路上,周围是被雪覆盖的田野。在一瞬间,你的眼睛会处理场景,挑选出单独的物体来聚焦——一个停车标志,一个谷仓——而场景的其余部分则在外围模糊。当你坐在办公桌前时,你的大脑将聚焦和模糊的图像存储为记忆,稍后可以在脑海中描绘出来

宾夕法尼亚州立大学电气工程研究人员模仿人眼这种简单、即时的图像处理能力,创建了一种超表面:一种类似于载玻片的光学元件,使用放置在不同角度的微小纳米结构来控制光。在通讯作者、宾夕法尼亚州立大学电气工程与计算机科学副教授倪兴杰的带领下,该团队在《自然通讯》上发表了他们的发明

研究人员表示,人工智能(AI)系统需要大量的计算能力和能量,处理图像和识别物体的速度可能很慢。相比之下,元表面可以用于在图像被相机捕捉之前对其进行预处理和变换,从而使计算机和人工智能能够以最小的功率和数据带宽对其进行处理

元表面的工作原理是将图像从笛卡尔坐标系转换为对数极坐标系,笛卡尔坐标系中图像像素沿x和y轴排列成直行和直列,对数极坐标系统使用类似牛眼的像素分布

“就像人眼内部光受体的排列一样,元表面拍摄图像并将其排列在对数极坐标系中——中心、聚焦特征的像素更密集,外围区域的像素更稀疏,”Ni说。“这样可以让照片中更重要的部分清晰地显示出来,而其他部分则保持较少的焦点,从而节省数据带宽。”

元表面位于相机前面,这样光线首先穿过它,并将图像从笛卡尔坐标系转换为对数极坐标,然后由相机数字化并传输到计算机。由于它使用弯曲光的纳米结构工作,因此超表面不需要任何功率,以光速工作

“由于物体的图像可能在大小或方向上有所不同,因此需要对图像进行预处理,使其能够抵抗缩放和旋转的变化,”Ni说。“这种预处理有助于人工智能应用程序更容易地将它们识别为同一对象。”

通过在相机前放置不同的元表面,研究人员还可以将对数极坐标图像转换回笛卡尔坐标的原始图像

研究人员表示,这项发明有许多潜在的应用,包括用于目标跟踪和监视,例如绘制汽车如何在城市中行驶的地图

倪说:“元表面可以与人工智能系统协同使用,作为预处理器,更容易从多个街景摄像头中识别同一辆车。”。“或者,如果将其应用于卫星,它可能会跟踪飞机从起飞到降落的过程。”

More information:Xingwang Zhang et al, All-optical geometric image transformations enabled by ultrathin metasurfaces, Nature Communications (2023). DOI: 10.1038/s41467-023-43981-x

Provided by Pennsylvania State University

排行榜

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567