北京航空航天大学王帆团队:无透镜散射相机实现时间压缩边缘成像
Publish Time:06-29

在计算光学成像领域,如何高效提取图像边缘特征并实现动态场景的高速捕捉一直是研究热点。近日,北京航空航天大学王帆团队联合国内外研究机构在Optics Letters发表研究,提出了一种基于无透镜散射相机的时间压缩边缘成像方法(Diffuser-eCam),首次实现了从单次2D散斑测量中直接重建移动物体的边缘图像序列,为动态场景的实时边缘检测提供了新范式。该技术绕开传统方法中“先重建原始图像——再后处理”的流程,通过光学编码与算法优化的深度结合,在提升边缘成像质量的同时,实现了帧率的数十倍提升。


传统无透镜成像的痛点-边缘检测的流程瓶颈

 

无透镜成像技术凭借小型化、低成本的优势,已在3D深度成像、光谱成像等领域展现潜力。其核心原理是利用调制器对光场的调制作用,将物体信息编码,再通过算法重建原始图像。然而,当涉及边缘检测等高级视觉任务时,传统流程存在显著缺陷:需先重建完整图像,再通过滤波算子(如Sobel、Canny)提取边缘,这不仅增加计算量,还会因中间重建步骤引入噪声累积,尤其在动态场景中难以保证时间分辨率。

关键挑战:边缘信息本质上是图像的高频特征,传统方法将其作为原始图像的“后处理结果”,忽略了边缘本身的稀疏性优势。若能直接从原始数据中提取边缘,不仅可简化流程,还能利用稀疏重建算法提升信噪比。


技术核心-嵌入边缘算子的无透镜边缘成像新框架

1. 光学系统设计与时间编码

Diffuser-eCam采用无透镜架构,核心元件为随机散射片与CMOS传感器。系统利用散射的“光学记忆效应”——当物体位于记忆效应区域内时,点扩散函数(PSF)的形状不变,仅发生空间平移,这为统一建模提供了前提。

时间压缩的关键:传感器工作在“卷帘快门”模式,不同行像素按顺序在不同时刻曝光。这种设计将时间维度的动态信息“折叠”到空间维度的像素行中,使得单次2D测量可记录物体在不同时刻的状态。例如,传感器的第r行像素对应物体在t时刻的投影,通过行数据与时间的映射关系,实现“单次测量=多帧时间序列”的编码。

 

图1 Diffuser-eCam的原理

 

2. 算法创新:边缘算子嵌入正向模型

传统成像模型为y=AXobj(y为测量值,A前向模型矩阵,Xobj为原始图像)。新方法引入边缘检测算子R(如3×3差分矩阵),通过矩阵变换将模型改写为:y=A′Xedge,其中A′=ARm−1,其中Rm为算子R的矩阵形式,Xedge为边缘图像。进而可以通过压缩感知算法(如TwIST)可直接从y中重建边缘,无需经过Xobj重建步骤,避免了中间环节的误差累积。

核心优势:边缘在一般变换域(如小波域)具有比原始物体更高的稀疏性,直接重建边缘图像可利用这一特性提升抗噪能力。理论分析表明,当边缘稀疏度高于原始图像时,该方法的信噪比增益可达3-5 dB。

 

图2 使用Diffuser-eCam和“传统后处理方法”在采样率30%、50%和70%时的边缘检测模拟结果

 

实验验证-静态与动态场景的性能突破

1.静态边缘检测:质量与效率双提升

研究团队对“手掌”、“肿瘤组织”等图像进行模拟与实验验证,对比Diffuser-eCam与传统“重建+后处理”方法。结果显示:当采样率为50%时,Diffuser-eCam重建的边缘图像背景噪声更低,细节保留更完整(如手掌纹路、肿瘤边界)。

量化指标:峰值信噪比(PSNR):Diffuser-eCam比传统方法高3-5 dB,表明噪声水平显著降低;信息熵(IE):IE值提升10%-15%,说明边缘信息丰富度更高。

 

图3 使用Diffuser-eCam和“传统后处理方法”在采样率为50%时对于真实物体边缘检测实验结果

 

2. 动态场景重建:时间分辨率的突破

以3D打印“汽车”模型为动态对象,系统通过滚动快门模式单次测量,直接重建出36帧边缘图像序列,等效帧率达588 fps,而传感器实际帧率仅14 fps。相比之下,传统透镜系统在相同条件下因滚动快门效应导致图像严重扭曲,边缘检测结果失真。

技术亮点:通过行像素与时间的映射算法,Diffuser-eCam实现了“空间-时间”维度的解耦,使低速传感器具备高速动态捕捉能力,这对生物细胞运动监测、高速摄像等场景具有重要价值。

 

图4 Diffuser-eCam从单张二维原始数据中重建运动物体多帧边缘图像的实验演示
与之对比,直接拍摄并重建的结果会出现扭曲

 

总结与展望

这项研究的核心价值在于打破了“成像=先复原再处理”的固有思维,通过光学与算法的协同设计,将边缘检测这一核心视觉任务嵌入成像流程的最前端,其展现的“任务导向型”成像理念,为计算光学领域提供了可落地的创新范式。团队计划将波长编码、偏振分析等功能融入Diffuser-eCam,构建“边缘+光谱+偏振”的多维成像系统。同时,结合深度学习优化重建算法,提升复杂场景下的抗噪能力与重建速度。


本文作者

郑泽 上海交通大学(电子信息与电气工程学院)

 

参考文献

[1] Ze Zheng, Baolei Liu, Jiaqi Song, Lei Ding, Xiaolan Zhong, Lingqian Chang, Xiaojun Wu, David McGloin, and Fan Wang, "Temporal compressive edge imaging enabled by a lensless diffuser camera," Opt. Lett. 49, 3058-3061 (2024).