基于深度学习的雷达目标检测技术

刘军伟1,2,李 川1,2,聂熠文1,2,崔国龙3,汪育苗3,徐瑞昆1,2

(1. 中国电子科技集团公司第三十八研究所,安徽合肥 230088; 2. 孔径阵列与空间探测安徽省重点实验室,安徽合肥 230088; 3. 电子科技大学信息与通信工程学院,四川成都 611731)

摘 要: 根据纽曼-皮尔逊准则,恒虚警方法(CFAR)在虚警率10-6、检测概率90%的条件下,可检测目标的信噪比需大于12.8 dB。由于可用于参考的环境单元有限且实际环境中杂波分布差异性大,特别是隐身、低慢小等目标的能量强度值很难达到检测门限的要求。本文基于深度学习方法,利用含杂波/噪声/干扰的目标距离多普勒(RD)域图像与相应理想情况下的目标RD图作为网络训练数据集,网络中的生成模型向判决模型提供抑制处理后的RD图,根据判决模型反馈来调整杂波抑制处理参数。这一动态对抗博弈的过程最终优化所得的生成模型将有效学习环境中杂波/噪声/干扰的特性并将其过滤。通过杂波、噪声和干扰环境下的实验证明,本文方法可以在RD域有效抑制杂波,增强目标信息,具备在实际杂波抑制场景下的可行性。

关键词: 雷达目标检测; 杂波抑制; 深度学习; 条件生成对抗网络

0 引 言

传统雷达检测技术主要通过利用回波能量来完成目标检测。在实际场景中,雷达回波不仅包含目标信息,还包含诸如地杂波、海杂波、干扰等杂波及背景信息。传统的恒虚警检测(Constant False Alarm Rate,CFAR)方法[1-3]使用一个电平由杂波和雷达回波附近的噪声决定的自适应门限值来发现回波中的目标。根据纽曼-皮尔逊准则,在保证虚警率下,CFAR可检测到目标的信噪比需大于12.8 dB。由于可用于参考的单元环境有限,且受到时间、空间、频率、功率、波形、极化、算力等资源的限制,最终捕获的雷达目标信号能量未必能超过门限,对于微弱目标容易造成漏警/虚警。此外,传统的目标检测方法本质上是对回波信号进行统计分析,提取具有代表性的统计特征,通过对统计特征的判断实现对目标的检测。但在实际应用中,地物杂波与目标所处环境紧密相关,沙漠、海洋、高原等不同地形下杂波分布存在差异,城市、郊区等不同环境下杂波分布也不相同,森林、草原等不同植被条件下的杂波情况也各有差异,甚至不同天气环境下杂波的分布也不尽相同。因此根据环境提供差异化、符合环境杂波特性的目标检测方法,对于在不同环境下及时准确地发现雷达目标具有重要意义。

深度学习[4-8]是机器学习领域中一个新的研究方向。2012年基于深度学习技术实现的深度卷积神经网络AlexNet在ImageNet大规模视觉识别挑战赛获得冠军,自此基于深度学习的目标检测方法逐渐走入研究人员的视野。目前深度学习也被广泛应用到目标检测中,如在沙漠环境下的SAR图像目标检测[9]、基于卷积神经网络的SAR图像车辆[10]、飞机[11]等目标的检测。

基于深度学习的目标检测方法可分为两类,一类为基于候选区域方式,另一类为基于端到端[12]方式。基于候选区域的方式,目标所在区域会被作为候选窗,从候选窗中提取特征,神经网络模型依据提取出的特征再去判断区域中是否有目标。这种方法可以有效减少人工判断目标特征的工作量,且可发现利用一些并不直接可视的特征,提高目标发现概率,但候选窗产生和特征提取分类步骤分离,难以实现工程实时性要求。另一种基于端到端的方式相比于候选区域方式则牺牲一定检测精度换取工程化应用的实时性。

针对环境多样性造成的杂波分布差异性,本文提出一种利用条件生成对抗网络(Conditional Generative Adversarial Nets,CGAN)建立的距离-多普勒(Range-Doppler,RD)域杂波抑制处理方法,对抗式训练一种可以从带有杂波干扰的复杂分布中找到感兴趣目标的生成模型,从而达到抑制杂波干扰,提升目标信噪比的目的。

1 问题背景与基本定义

1.1 问题描述

杂波抑制的目的是保留目标的同时消除杂波干扰,从另一理想角度来说是从干扰杂波中提取感兴趣目标的过程。在不发生突变的环境下,感兴趣目标往往处于特定分布上,而雷达采集到的回波数据处于另一种复杂高维分布,其中隐藏着感兴趣目标的分布,我们的目的就是利用CGAN网络在高维空间的复杂杂波分布中找到目标的特定分布并将其提取放大,从而检测。

CGAN的训练并不是随机生成,而是一一对应进行生成,因此考虑采用图像解译的思想,结合感兴趣目标的分布作为生成与对抗中的监督信息辅助提取。若环境发生变化,通过网络模型的再训练来学习这种变化,从而达到对环境变化的及时响应,保证目标检测效果。

1.2 生成对抗网络

生成对抗网络是一种无监督学习方法,包含生成模型(Generator,G)和判决模型(Discriminator,D)两个组成模块,在相互博弈学习中获得优化的网络结构和参数。通过对每个小区域进行差别判别,实现对局部特征的提取和表征,之后在对抗过程中将局部特征与整体特征相融合,不断迭代。

1.3 基本过程

如图1所示,首先以少量有标签时域杂波/干扰抑制后的距离像作为杂波抑制模块的输入,顺序使用传统雷达目标检测跟踪方法中的动目标显示(Moving Target Indication,MTI)和动目标检测(Moving Target Detection,MTD)进行处理,得到RD矩阵;后将二维RD矩阵输入生成对抗网络进行对抗训练;待结果收敛,输出杂波抑制后的RD矩阵以及此时训练所得的生成对抗网络模型参数。

图1 RD域杂波抑制网络训练过程

2 RD域杂波抑制处理流程

2.1 预处理

以距离像的二维矩阵为输入,每一行都对应于对一个脉冲回波的连续采样,即连续的距离单元。行中的每一个元素都是一个复数,代表一个距离单元的I通道分量以及Q通道分量,每一列代表对同一距离单元的多个脉冲测量。MTI是对矩阵的列数据(同一距离单元的数据)进行操作。当固定目标、地杂波等与运动目标处于同一距离单元时,因固定目标回波中的多普勒频率为零。因此,若将同一距离单元在相邻脉冲中作相减运算,则运动目标回波得以保留,可以除去零频附近的杂波和静止的目标。

由于雷达数据为非均匀脉冲重复间隔(Pulse Repetition Interval,PRI),所以无法对二维矩阵中列数据作傅里叶变换。目标所在距离单元的慢时域回波向量如式(1)所示:

gr=[ej2πfdt1,ej2πfdt2,…,ej2πfdtN]T

(1)

因此采取利用非均匀离散傅里叶变换(Non-Uniform Discrete Fourier Transform,NUDFT)滤波器对目标回波的相位进行相参积累。经过NUDFT处理后的数据依然为一个二维矩阵,输入MTI进行处理。NUDFT滤波器矩阵如式(2)所示:

(2)

慢时域回波信号经过NUDFT积累后,目标所在距离单元的多普勒电平可表示为

(3)

式中,fi(i=1,2,…,N)表示多普勒域的采样频点,当fd=fi时,相参积累增益达到最大,最大值为1。经过数据预处理可得到两类数据样本,并分别按一定比例划入训练集和测试集。

2.2 模型训练

有标签的一维距离像和理想一维距离像为网络训练的输入,其中第二类数据为引导信息,引导生成模型将第一类数据朝着理想数据去生成。生成模型给判决模型输送包含杂波干扰的样本,判决模型识别杂波条件下的样本和仅有目标存在的样本及不匹配样本。生成的数据通过判别模型去判别与理想数据的差异,结果反馈给生成模型;生成模型再依据差异去处理包含干扰的数据。生成模型和判别模型不断运转和对抗,直到判别模型无法判别生成的数据是否是理想数据,即生成数据已经十分逼近理想数据,此时输出生成器模型参数。通过生成模型与判决模型的对抗过程,CGAN在保留目标的同时去除杂波干扰。其训练过程如图2所示。

图2 模型训练过程

CGAN在生成模型和判决模型中均使用目标信息标签进行训练,不仅能产生仅有目标存在的特定标签的数据,还能够提高生成的杂波抑制后数据的质量。训练过程中,CGAN优化函数由两部分组成,分别为条件生成对抗网络的误差函数LCGAN(G,D)和生成器判别误差函数L1(G)组成,两者按照参数λ进行权重分配:

(4)

条件生成对抗网络的误差函数和生成器判别误差函数分别为

LCGAN(G,D)=Ey[logD(y)]+

Ex,z[log(1-D(G(x,z)))]

(5)

L1(G)=Ex,y,z[‖y-G(x,z)‖1]

(6)

式中,y表示指导信息,z表示条件信息,x表示生成信息。

2.3 模型测试

利用训练好的模型对在线采集的数据进行杂波/干扰抑制。根据模型在大量无标签基带雷达回波数据上的表现,分析该杂波抑制网络的泛化性能。经过该条件生成网络处理后,目标信息在RD域的杂波和干扰得到一定程度的抑制,最终得到RD域杂波/干扰抑制后结果。将该结果作为目标检测网络的输入,进而实现目标检测的目的。测试过程如图3所示。

图3 模型测试过程

3 实验结果及分析

3.1 实验设置

为了验证基于条件生成对抗网络的RD域杂波抑制网络可行性,通过仿真雷达实际波形,并分别添加切片(Chopping Interleaving,CI)、弥散频谱(Smeared Spectrum,SMSP)干扰、瑞利分布杂波和高斯白噪声来模拟真实数据中某一个波束的回波数据;将进行预处理后得到的RD图送入CGAN网络进行杂波/干扰抑制,比对抑制效果,证明基于条件生成对抗网络的RD域杂波/干扰抑制网络可行性。

为模拟复杂电磁环境,本实验选取新式灵巧CI和SMSP干扰。首先产生CI干扰,使用一等间距的矩形脉冲串对信号采样,并将采样后的信号复制到相邻的间隙中,直到间隙被填充满。SMSP干扰产生是利用信号载频在脉冲宽度内随时间线性变化这一规律产生的。先对原始信号在时域上采样,再将时钟频率提高到原来的n倍,对采样数据进行抽取并按原顺序进行排序,然后对排序后的信号复制n次,便可产生SMSP干扰。

在雷达可分辨范围内,当散射体的数目很多时,如气象杂波、箔条干扰等,根据散射体反射信号振幅和相位的随机特性,它们合成的回波包络振幅服从瑞利分布。因此我们采用瑞利分布来模拟杂波分布。瑞利分布的概率密度函数为

(7)

高斯白噪声能部分反映雷达通道中的噪声情况,故噪声样式使用高斯白噪声。高斯白噪声的概率分布为高斯分布,其二阶矩不相关而一阶矩为常数,高斯分布的一维概率密度函数可表示为

(8)

通过预处理可以获得两类目标参数完全一致的数据,第一类数据为包含噪声/干扰/杂波有标签RD图,第二类数据为理想环境下目标RD图。实验分为训练模型和测试模型,其中训练集包含600个样本,进行200轮迭代训练;测试集包含 8 000个样本,进行验证。

3.2 实验结果

存在噪声时,基于条件生成对抗网络的杂波抑制RD图距离维对比效果如图4所示。图中纵坐标为各距离段上的目标值除以整个距离段上目标最大值的归一化结果。

图4 高斯白噪声模式下效果

存在瑞利分布杂波时,基于条件生成对抗网络的杂波抑制的RD图距离维效果如图5所示。图中纵坐标为各距离段上的目标值除以整个距离段上目标最大值的归一化结果。

图5 瑞利分布杂波环境下效果

从图4、图5可知,本方法在对于杂波和噪声的抑制效果较为明显,相同虚警率下等效检测门限下降3.2 dB,杂波抑制效果明显,有效突出目标。

存在CI干扰和SMSP干扰时,基于条件生成对抗网络的杂波抑制效果分别如图6和图7所示。与原本RD图相比,经CGAN网络处理后的RD图干扰信号几乎清除干净,目标信号明显,说明本方法对于CI、SMSP干扰抑制效果显著。

图6 CI干扰环境下效果

图7 SMSP干扰环境下效果

上述实验数据表明,在新型灵巧CI和SMSP干扰、瑞利分布杂波、噪声存在的情况下,经过CGAN网络杂波抑制,目标信息均可得到有效增强,本方法的可行性和效果可得到验证。此外通过对杂波抑制后输出点迹的统计,与恒虚警检测方法相比,点迹数减少32.3%,本方法可有效减少杂波点数目。

4 结束语

针对传统目标检测恒虚警方法对雷达微弱目标检测性能的限制,本文提出了一种基于条件生成对抗网络的RD域杂波抑制方法。对雷达回波数据的实验表明,本文方法可避开12.8 dB的限制,在抑制杂波和噪声,提升目标信号显著度方面具有良好性能,为改善雷达杂波抑制和目标检测效果提供新的可行途径。

参考文献

[1] STEENSON B O. Detection Performance of a Mean- Level Threshold[J]. IEEE Trans on Aerospace and Electronic Systems,1968,4(4):529-534.

[2] 何友,关键,彭应宁. 雷达自动检测与恒虚警处理[M]. 北京: 清华大学出版社,1999.

[3] TRUNK G V. Range Resolution of Targets Using Automatic Detectors[J]. IEEE Trans on Aerospace and Electronic Systems,1978,14(5):750-755.

[4] GOODFELLOW I J,WARDE-FARLEY D,MIRZA M,et al. Maxout Networks [C] ∥30th International Conference on Machine Learning,Atlanta: IMLS,2013:2356-2364.

[5] GOODFELLOW I J,POUGET-ABADIE J,MIRZA M,et al. Generative Adversarial Nets[C]∥ Proceedings of the 27th International Conference on Neural Information Processing Systems,Cambridge,MA,USA:MIT Press,2014:2672-2680.

[6] MIRZA M,OSINDERO S. Conditional Generative Adversarial Nets[J]. arXiv,2014:2672-2680.

[7] SHI M J,CAESAR H,FERRARI V. Weakly Supervised Object Localization Using Things and Stuff Transfer[C]∥2017 IEEE International Conference on Computer Vision,Venice,Italy:IEEE,2017:3401-3410.

[8] KLAMBAUER G,UNTERTHINER T,MAYR A,et al.Self-Normalizing Neural Networks[J].Advances in Neural Information Processing Systems,2017:1-9.

[9] 夏勇,田西兰,常沛,等,基于深度学习的复杂沙漠背景SAR目标检测[J]. 雷达科学与技术,2019,17(3):305-309.

[10] 常沛,夏勇,李玉景,等,基于CNN的SAR车辆目标检测[J]. 雷达科学与技术,2019,17(2):220-224.

[11] 王思雨,高鑫,孙皓,等,基于卷积神经网络的高分辨率SAR图像飞机目标检测方法[J]. 雷达学报,2017,6(2):195-203.

[12] 聂凡杰. 基于端到端的深度学习目标检测算法研究[D]. 北京:北京邮电大学,2018.

A Target Detection Method Based on Deep Learning

LIU Junwei1,2,LI Chuan1,2,NIE Yiwen1,2,CUI Guolong3,WANG Yumiao3,XU Ruikun1,2

(1. The 38th Research Institute of China Electronics Technology Group Corporation,Hefei 230088,China; 2. Key Laboratory of Aperture Array and Space Application,Hefei 230088,China; 3. School of Information and Communication Engineering,University of Electronic Science and Technology of China,Chengdu 611731,China)

AbstractAccording to Newman-Pearson criterion,constant false alarm rate (CFAR) method needs signal to noise ratio (SNR) higher than 12.8 dB to detect a target,w.r.t. 10-6 false alarm ratio and 90% detection possibility. However,due to limited environmental units for detection and variety of clutter distributions in practice scenarios,target energy is hard to reach the threshold,especially for invisible,low and small targets. In this paper,based on deep learning method,using range-Doppler (RD) image of targets with clutter,noise and jamming,and corresponding ideal RD images as training dataset,we build a conditional generative adversarial network. In this network,a generator provides after-processing RD images to a discriminator,and the feedbacks of the discriminator are used to adjust the processing parameters in the generator. The dynamic adversarial gaming process can learn the features of clutter,noise and jamming in the environment and filter them out. Through experiments under the environments with clutter,noise and jamming,our model is validated effective for suppressing clutter and sharpening target signal,and is also feasible in pratical clutter scenarios.

Key words radar target detection; clutter suppression; deep learning; conditional generative adversarial nets

DOI:10.3969/j.issn.1672-2337.2020.06.015

收稿日期: 2020-06-24; 修回日期: 2020-07-17

中图分类号:TN957.5

文献标志码:A

文章编号:1672-2337(2020)06-0667-05

作者简介

刘军伟 男,1982年生,山东人,博士,高级工程师,2009年毕业于中国科学技术大学,主要研究方向为雷达软件系统、数据处理、目标检测、多源信息融合、人工智能。
E-mail:hfjwliu4@163.com

李 川 男,1965年生,河南人,1985年毕业于桂林电子工业学院计算机及应用专业,现为中国电子科技集团公司第三十八研究所研究员、副总工程师,主要研究方向为雷达数据处理,主持过多项国家重点工程产品的软件设计。

聂熠文 女,1992年生,安徽人,博士,工程师,2019年毕业于中国科学技术大学,主要研究方向为雷达数据处理、目标跟踪、多源信息融合、数据挖掘。

崔国龙 男,1982年生,安徽人,电子科技大学教授、博士生导师,主要研究方向为最优化理论和算法、雷达目标检测理论、波形多样性以及阵列信号处理。

汪育苗 女,1996年生,江西人,电子科技大学博士研究生,主要研究方向为信号处理、基于智能学习的目标检测算法。

徐瑞昆 男,1992年生,安徽人,博士,工程师,2019年毕业于华中科技大学,主要研究方向为雷达信号处理、目标跟踪、目标检测、人工智能。