人体的日常活动包含着大量信息,是与外界信息交换的重要方式,能够在特定场合直观地传递有效信息。人体活动监测在安防监控、人机交互、医疗监护等领域中发挥着重要的作用。因此,近年来随着智能物联网的普及和发展,人体活动分类的问题也成为研究的一大热点。雷达传感器以其独有的优势吸引了许多研究者的目光,利用雷达进行人体活动分类的研究也不断涌现。雷达进行人体活动分类通常包含两步:一是人体目标检测;二是活动分类。
对于人体目标检测,常见的检测器如恒虚警检测器(Constant False Alarm Rate,CFAR)被广泛应用。CFAR检测器是指假定噪声服从某一分布时,设定恒虚警概率对输入信号进行判别,最后进行目标检测的方法。文献[1]利用改进的CFAR检测器,提出了一种新的基于可变窗口的CFAR图像舰船目标检测算法,其仿真结果表明该算法的优越性。在文献[2]中,对数排序统计恒虚警检测器(Ordered-Statistic Constant-False-Alarm-Rate,OS-CFAR)用于每帧距离单元的有效点检测,进行人体目标探测和跟踪。
对于活动分类,大部分学者利用微多普勒效应对人体雷达回波进行特征提取,进行目标的活动分类。人体的微多普勒效应最早由Chen[3]提出,是指由于人体这种多散射点目标对雷达有着不同的径向速度,因此能够产生不同多普勒频移的效应。文献[4]则进一步提取微多普勒特征,采用支持向量机(Support Vector Machine,SVM)分类器对人体动作进行分类。随着深度学习的发展,越来越多研究者采用卷积神经网络(Convolution Neural Network,CNN)这种分类器,利用人体微多普勒信息进行人员的活动分类[5-8],并且都取得了可观效果。在文献[9]中,作者利用多个雷达传感器对微多普勒特征采用长短期记忆神经网络(Long Short-Term Memory,LSTM),也取得了较好的性能。然而,虽然深度学习在一定程度上取得了很好的效果,但是这种处理方法需要消耗较大的计算资源,并不一定能够保证实时性的计算结果。在智能物联网应用中,边缘计算在传输和延时方面是明显优于云端计算的。因此,提供一种低复杂度、计算需求小的活动分类方法,在一定程度上能够完成物联网终端边缘计算的目标。
本文提出一种基于脉冲超宽带(Impulse Radio Ultra-Wideband,IR-UWB)雷达的低复杂度室内人员日常活动分类方法。该方法首先利用改进的OS-CFAR检测有效距离单元目标;其次,提取基于平均多普勒频率、信息量和多普勒能量的3种微多普勒特征进行动静目标粗分类;最后,对于动目标采用两个细胞单元的长短期记忆神经网络(LSTM)对人体活动进行细分类。日常人体活动类别有:静止、走路、坐下和起立。实验结果表明:细分类别下(走路、坐下和起立)的测试准确率能够达到92.52%。
基于对人体探测安全的考虑,本文选用Novelda公司生产的X4M03[10]雷达模块,该雷达模块的功率仅为118 mW,具有低功耗的特点。X4M03雷达模块是发射高斯包络的脉冲多普勒雷达,其载频为7.29 GHz,信号有效带宽为1.4 GHz,硬件射频采样率为23.328 GHz。发射信号模型如下:
(1)
式中,V为电压值,t为快时间,ωc为载频,τ由雷达带宽fb决定,表示为
(2)
对于回波信号,首先硬件对回波进行采样得到射频信号。接着对射频信号进行移动平均杂波抑制去除背景静止杂波[2],利用数字混频获得包络信息,由此取模得到慢时间-距离图(以下简称时距图)。
如图1所示,本文实验是针对室内环境下人体活动展开探测。因此,该场景不仅会有很多强的静止杂波,还会有大量多径效应存在,将对识别产生强干扰。为了去除杂波信息和避免雷达多径效应对人体微多普勒信息的干扰,这里利用幅度拐点的OS-CFAR检测器对雷达时距图进行目标检测。
图1 实验场景
首先,对每一帧多个距离单元的幅度进行排序,求排序后的二阶导数,进而得到拐点。将拐点对应的幅度提取出来。如果排序后没有拐点,则说明该帧很大概率没有目标信息,此时取最大幅度代替拐点幅度。由此,每一帧都将得到一个幅度排序后拐点的值。
其次,以滑窗的形式,每窗积累20帧数据统计幅度的值。对于杂波数据,观察统计的幅度,取对数之后可以近似认为服从均值为μ,方差为σ2的高斯分布。图2为积累1 min后对数幅度排序之后的统计直方图,可以明显看到服从高斯分布。
图2 对数幅度排序统计直方图
最后,得到杂波的分布后,设定一个门限值Th,对每一帧下的距离单元进行判定,若满足如下条件,则认为是有效距离单元点:
(3)
式中,x(n,k)为雷达时距图,n为帧序列,k为距离单元序列。
同时,选取每一帧最靠近雷达的10个有效距离单元点为有效目标点,这是为了避免后面的多径效应所带来的有效单元点。图3(a)是经过检测器后的时距图,图3(b)是未经过检测器的时距图。从图中结果可以明显看出:检测器能够避免雷达多径效应和杂波影响。
图3 有无检测器的时距图对比
在除去噪声和多径效应后,对时距图提取微多普勒特征,可以得到更加干净的谱图,这也是后续可以采用较低复杂度的分类器进行分类的原因。微多普勒谱图是通过短时傅里叶变换得到的,如图4为走路—坐下—起立—走路的时频图。其变换如下:
图4 时频图(走路-坐下-起立-走路)
S(n,ω)=
(4)
式中,x(n,k)为雷达时距图,n为帧序列,k为距离单元序列,ω为变换频率,w(m)为高斯窗函数。
对变换后的时频图提取了3个特征,利用3个特征可以对目标进行动静粗分类。
1) 躯干多普勒频率(速度),提取公式如下:
(5)
式中,F为短时傅里叶变换的点数。
2) 中高频信息量,公式如下:
(6)
式中,f∈φ表示f包含所有频率。
3) 多普勒能量值,公式如下:
(7)
按0.1 s进行滑窗,窗的长度为1 s,分别对1 s内的3个特征值求平均,得到该时刻下的特征值。图5显示了3种特征值随时间的变化。对于每一个特征值均可设定一个区分运动和静止的门限值,超过某一门限值则判定为运动。若3个特征有超过2个判定运动(或者静止),则认为目标在运动。区分动静目标后,第2节将介绍动目标细分类方法。
图5 3个特征值随时间变化图
对于已经粗分类后的人体活动,本文将利用LSTM网络进行细分类。首先,需要将由运动到静止和由静止到运动两种状态找出来,提取这种短时间内状态转换的时频图作为样本。选取该时刻前后一共两秒的时间为样本的序列长度。由于雷达的帧数设定为100帧,短时傅里叶变换的点数为80点,因此,样本为200*80的矩阵图。
将矩阵图进行LSTM网络的训练,可以得到训练好的模型,进而对测试集进行分类。本次实验一共有7个人参与了实验,得到样本有1 390个。
为了降低计算复杂度和充分利用时频矩阵的时序性,这里采用两个细胞单元的LSTM网络进行训练,LSTM层后面通过Softmax层进行三分类。每个LSTM层有100个神经元。
LSTM网络结构(如图6所示)的输入由新输入xt和上一步的输出值ht-1组成,输出由ct和ht组成。ct的作用是负责记忆信息的细胞单元。整个LSTM网络中,还有中间单元,包括遗忘门、输入门和输出门。LSTM每一步的计算流程如下公式所示:
图6 LSTM网络结构
(8)
(9)
(10)
(11)
(12)
(13)
式中,wf,wi,wc,wo分别是不同单元的权重,bf,bi,bc,bo分别指不同单元的偏置。sigmoid函数和tanh函数如下公式所示。通过不停迭代权重和偏置,让网络学习到特征的分布,进而识别出相应的动作。
(14)
(15)
本节将基于实测数据分析本文提出的方法在室内环境下的分类识别效果。本实验采用5-折交叉验证的方法说明算法精度。5-折交叉验证是将所有样本分为5堆样本集,依次提取5堆样本中的其中一堆作为测试集,其他4堆作为训练集进行网络训练。因此,每个模型参数都需要进行5次训练,取测试集精度的平均值作为最终的训练效果。每次实验迭代次数为500次。本文将对比不同LSTM细胞个数和不同LSTM神经元个数对结果的影响,从而得出最优的模型。
表1显示了两个LSTM结构下,不同神经元数目的性能对比。表2显示了100个神经元下不同LSTM结构数目的性能对比。综合两个表,可以看到:在100个神经元和两个LSTM结构下,得到了92.52%的最高准确率。
表1 两个LSTM结构下不同神经元数目的性能对比
实验神经元个数8090100110120193.53%91.73%92.45%91.37%89.57%289.57%90.65%94.24%90.65%93.17%388.49%91.37%91.37%90.29%91.37%486.33%89.21%92.09%90.29%90.29%594.24%93.88%92.45%92.45%93.88%平均值90.43%91.37%92.52%91.01%91.65%
表 2 100个神经元下LSTM结构不同数目的性能对比
实验LSTM结构数1个2个3个185.97%92.45%94.24%289.57%94.24%91.37%386.33%91.37%89.93%484.89%92.09%90.29%591.01%92.45%95.68%平均值87.55%92.52%92.37%
图7显示了在最高准确率下,每次实验的准确率与迭代次数的关系。这些实验结果充分说明了本文算法的可行性。
图7 最高准确率下5次实验的测试精度与迭代关系
在复杂度和精度方面,本小节将通过对比其他方法,进一步说明算法的可行性。在特征分类中,常用的分类器如SVM、卷积神经网络、LSTM网络将用来作算法的对比。
整个的对比结果可以用表3来概括。对比文献[9]同样采用的LSTM网络,该方法将3个雷达采集数据应用于两个800个神经元的LSTM细胞单元进行识别,达到了最高准确率98.19%。虽然该方法一共识别了21个动作且准确率较高,但是3个雷达采集数据获得3个时频图的方式限制了其应用场景,同时一共1 600个神经元的结构也大大超过本文200个神经元的结构。对比文献[4]采用的6个SVM模型,虽然SVM比起神经网络复杂度低一点,但是其准确率最高只有90%,低于本文的准确率。对比文献[5]采用的传统卷积神经网络,该网络在最高准确率96.9%下采用3个卷积层和池化层,2个全连接层。其中每个卷积层有20个5*5的卷积结构,2*2的最大池化层,2个全连接层分别包含500个神经元和7个神经元。这些参数个数是远高于本文的个数的。由此可见,相比已有的神经网络方法,本文算法的计算复杂度更低。
表3 与其他方法的对比
分类器活动类别数雷达数目样本类型与维度参数个数准确率6个SVM716个时频特征值—90.00%2个LSTM-8002133个时频图1600个神经元98.19%卷积神经网络81实部和虚部时频图224个卷积核,507个神经元96.90%2个LSTM-100411个时频图200个神经元92.52%
本文提出了一种基于IR-UWB雷达的低复杂度室内人员日常活动分类方法。首先,在室内复杂多径效应下,采用幅度拐点OS-CFAR检测方法提取有效距离单元;其次,采用微多普勒特征提取方法对动静目标进行粗分类;最后,采用两个细胞单元的LSTM网络对动目标进行细分类。实验结果表明:最终的测试平均准确率达到92.52%。
[1] CHEN S Y, LI X J. A New CFAR Algorithm Based on Variable Window for Ship Target Detection in SAR Images[J]. Signal, Image and Video Processing,2019,13(4):779-786.
[2] BAO R H, YANG Z C, CHENG Y G, et al. Short-Range Moving Human Detection Based-on Cascaded Spatial-Temporal Three-Stages Detector in UWB Radar[C]∥2019 IEEE International Conference on Signal Processing, Communications and Computing, Dalian, China:IEEE,2019:1-6.
[3] CHEN V C. Analysis of Radar Micro-Doppler with Time-Frequency Transform[C]∥Proceedings of the Tenth IEEE Workshop on Statistical Signal and Array Processing ,Pocono Manor, PA, USA:IEEE,2000:463-466.
[4] KIM Y, LING H. Human Activity Classification Based on Micro-Doppler Signatures Using a Support Vector Machine [J]. IEEE Trans on Geoscience and Remote Sensing,2009,47(5):1328-1337.
[5] KIM Y, MOON T. Human Detection and Activity Classification Based on Micro-Doppler Signatures Using Deep Convolutional Neural Networks [J]. IEEE Geoscience & Remote Sensing Letters,2016,13(1):8-12.
[6] SHI X R, LI Y X, ZHOU F, et al. Human Activity Recognition Based on Deep Learning Method[C]∥2018 International Conference on Radar (RADAR), Brisbane, Australia:IEEE,2018:1-5.
[7] CHEN Z X, LI G, FIORANELLI F, et al. Personnel Recognition and Gait Classification Based on Multistatic Micro-Doppler Signatures Using Deep Convolutional Neural Networks [J]. IEEE Geoscience & Remote Sensing Letters,2018,15(5):669-673.
[8] SEYFIOGLU M S, EROL B, GURBUZ S Z, et al. DNN Transfer Learning from Diversified Micro-Doppler for Motion Classification [J]. IEEE Trans on Aerospace & Electronic Systems,2019,55(5):2164-2180.
[9] CRALEY J, MURRAY T S, MENDAT D R, et al. Action Recognition Using Micro-Doppler Signatures and a Recurrent Neural Network [C]∥2017 51st Annual Conference on Information Sciences and Systems, Baltimore, USA:IEEE,2017:1-5.
[10] ANDERSEN N, GRANHAUG K, MICHAELSEN J A, et al. A 118-mW Pulse-Based Radar SoC in 55-nm CMOS for Non-Contact Human Vital Signs Detection [J]. IEEE Journal of Solid-State Circuits,2017,52(12):3421-3433.
阳召成 男,1984年出生,湖南浏阳人,博士,深圳大学电子与信息工程学院副教授,主要研究方向为雷达信号处理、区域感知与智能信息处理、阵列信号处理、机器学习。
赖佳磊 男,1997年出生,广东梅州人,深圳大学电子与信息工程学院硕士研究生,主要研究方向为雷达信号处理、目标识别。
鲍润晗 男,1996年出生,浙江奉化人,深圳大学电子与信息工程学院硕士研究生,主要研究方向为雷达信号处理、目标跟踪和识别。
周建华 男,1976年出生,广东惠州人,硕士,深圳大学电子与信息工程学院讲师,主要研究方向为嵌入式系统设计、智能穿戴产品设计、生物电信号处理。