首页天道酬勤随机森林算法的研究与应用(改进的随机森林算法)

随机森林算法的研究与应用(改进的随机森林算法)

admin 11-30 00:44 338次浏览

由于超声波在传播过程中不受光、烟、电磁干扰等因素的影响,超声波测距相对于其他测距方式具有明显的优势,受到无人驾驶领域的青睐[1]。

超声波测距一般采用脉冲回波法[2]。传统的回波法包括阈值法和互相关函数法。阈值法简单实用,实时性好,对近距离强回波峰信号有很好的检测能力,但对远距离弱回波峰信号难以适用。互相关函数法一般只能处理5 m [3]以内的回波信号,也不适用于障碍物的测距。此外,互相关函数法理论上只有一个最优点,因此不能在检测区域同时测量多个障碍物。为此,本文提出了一种基于随机森林算法的超声回波信号处理方法。通过对回波信号进行时域和频域分析,提取并融合时域和频域特征信息,利用随机森林算法判断检测区域内的障碍物并计算障碍物之间的距离[4]。

1传统超声波测距原理

脉冲回波测距的传统原理是通过脉冲激励超声波探头发射超声波,同时接收被测物体反射的超声波(简称回波)[5]。通过检测从发射超声波到接收回波的时间t,称为飞行时间,超声波探头和被测物体之间的距离d由以下公式计算,即:

其中,V为声波在空气介质中的传播速度,常温下V一般为340 m/s。

在设计超声波测距系统的电路时,需要考虑声强的衰减,因为声强会随着在空气中传播距离的增加而降低[6]。衰减是由声束本身的扩散、反射和散射现象引起的。假设初始声强为I0,距离x米后,由于吸收衰减,声强变为I,那么超声波的衰减可以用下面的公式表示:

其中为空气衰减系数。如果不采取一些增益补偿措施,距离越远,越难将障碍物信号与其他白噪声信号区分开来,使信号无法在后期进行分析处理。

基于随机森林算法的超声回波测距方法介绍

2.1测距系统设计

本文设计的超声波测距系统的组成如图1所示。考虑到测量距离长,声强衰减会很大。因此,在发射电路的设计中,增加发射电流以提高信号发射功率。同时,在接收电路中还设计了时间增益补偿电路,补偿空气传播过程中声强的衰减。通常,数字信号处理器包含一个带通滤波器,可以提高处理器(ARM)接收到的回波信号的质量。

2.2随机森林算法

随机森林算法是美国科学家BREIMAN L[8]提出的一种集成分类算法。该算法从训练集中随机选择一定数量的样本作为每棵树的根节点样本,在建立决策树时随机选择一定数量的候选属性作为分裂节点。由于引入了两个随机性[9],森林计算方法不容易被决策树过度拟合[11]。此外,随机森林方法可以在不显著增加计算量的情况下提高预测精度,并且具有良好的抗噪声能力。因此,本文采用这种方法来计算距离。

2.3时域和频域信号特征提取

为了使用随机森林方法,需要提取超声回波信号的时域和频域特征。

信号具有时域和频域的特点。在时域中,信号f(t)是时间的函数,它描述了信号的幅度、频率和相位随时间的关系。在频域中,信号F(j)是频率的函数,讨论了信号的幅度和相位与频率的关系[12]。信号可以在时域和频域之间转换

通过研究发现,当超声波遇到障碍物返回时,其反射波的频率f会出现在发射波的频率f0附近,导致频率f0附近的频谱幅度较大。例如,发射频率f0=48 kHz的脉冲方波,经带通滤波后得到原始回波信号波形S,如图2(a)所示。可以看出,在18 200 s~19 100 s和55 200 s~56 100 s的时间段内分别存在一个障碍物。为了测量距离,分别以上述两个时间段的最高点为飞行时间,根据公式(1),可以计算出两个障碍物之间的距离分别约为3.2 m和9.5 m。因此,找出障碍物所处的时间段是解决问题的关键。原始回波信号s分为n段,每段对应的时间段为t0。t0的大小与从开始时间到结束时间对应于回波信号中障碍物出现的时间段tobs有关。比如图2(a)中,tobs=900 s,如果t0太大,一段会有多个障碍物,会影响障碍物数量的判断。相反,如果t0太小,障碍物出现的时间段tobs将被分成几个连续的段。所以一般来说比较合适,这样的障碍物最多会被三个连续的段t0所包含,如果在后续的处理过程中判断相邻时间段存在障碍物,可以将其合并成一个时间间隔。选择t0后,回波信号S的总持续时间为高,则n=高/t0。然后,信号S1(I=1,2,n)通过FFT变换。当障碍物出现时,f0附近的谱幅会相对较强。如图2(b)所示,该图仅显示了图2(a)中两个障碍物所在的时间间隔附近的片段。可以看出,在障碍物所处的时间间隔内,段43和44的频谱幅度明显高于段42和45dddwd。类似地,时间间隔128和129中的另一个障碍物的频谱幅度高于时间间隔127和130中的频谱幅度。

基于以上分析,可以提取信号在时域和频域的一些特征。时域特征主要指信号的相对峰值幅度CT1,即信号包络在实时域的相对变化。以一段硅为例,计算方法如下:

p>

其中step为步长,ai为步长内所包含点的最大值,i=SN/step,SN为Si段中的总点数。提取的特征CT1的本质相当于提取了Si段的包络。

对时域信号Si段做FFT变换,得到频域幅度谱,截取发射频率f0附近的频段,设频段长度为2d,则其左边频率为f0-d,右边频率为f0+d。以左、右边频率构成区间[f0-d,f0+d],在该区间上提取频域特征:频谱相对面积CT2,即区间内的点所围成的面积。方差CT3,最大值CT4和极差CT5,其计算公式分别为:

2.4 利用随机森林法的测距方法

具体步骤如下:

(1)准备数据:在不同距离的位置测量障碍物(可以多个)的数据,每个位置采集三次,并做好标注。以其中一个原始信号S为例,把信号分成n段,根据上一节特征提取的方法,提取出每一段信号Si(i=1,2,…,n)的时域和频域特征:CT1i,CT2i,CT3i,CT4i,CT5i,并做好每一段的标注信息Li,即说明该段是否含有障碍物。每一个信号S有n个数据S1,S2,…,Sn。为了不使某一个特征值对结果影响过大,对每一个特征进行归一化处理,计算方式如下:

其中Xmax和Xmin分别为某一特征集中最大特征值和最小特征值。利用式(6)得到预处理后的数据集。

(2)训练数据:把预处理后的数据作为训练集,利用随机森林算法训练出分类器TB。

(3)预测数据:当测得一个新的信号数据时,把数据按照步骤(1)处理后,用训练好的随机森林分类器TB对数据集进行分类,判断出障碍物所在的时间段。如果两个时间段相邻,则合并这两个时间段为一个整体的时间区间,如果求出多个不相邻的时间区间,说明检测出多个障碍物。

(4)计算距离:找出在时间区间中的最大值,把该值所对应的时间点作为飞跃时间tmax,代入式(1),计算出障碍物距离d。

3 实验结果与分析

下面以同时测量两个障碍物为例来验证该算法,测试示意图如图3所示。在检测范围内,任意放置两个障碍物,用超声波测距系统进行测量。

实验中发射的脉冲方波振荡频率为48 kHz,采样频率为680 MHz,采样时间为62 638.55 μs。采集经过带通滤波后的原始数据点,得到采样点数为43 200个,画出的波形类似图2(a)。把原始数据分成144段,t0约为500 μs,每段有300个数据点,频域区间选取为[46 kHz,50 kHz],按照本文算法计算出障碍物的距离。通过对不同距离多个不同障碍物进行测量,得到实验结果如表1所示。结果表明,该算法可以在10 m之内,同时有效地完成对多个障碍物的距离测量。其误差在±3 cm之内,达到了实际的应用要求。在同一位置上进行多次测量,来评判随机森林算法的准确度,其实验结果如表2所示。结果表明该算法具有很好的障碍物识别度。

4 结论

本文提出的算法通过提取超声回波信号的时域和频域信息特征,然后利用随机森林算法判别出障碍物的个数并求出目标距离,可有效地解决因距离远、回波信号弱而造成的测距困难问题。该方法可以实现10 m内的多个障碍物距离测量功能,测量误差在±3 cm之内,达到了实际的应用需求,已经用于实际的自动驾驶场景中的矿场卡车项目里,取得了良好的效果,具有较高的实用价值和理论参考意义。

需要说明的是,可以在满足一定测量分辨率要求的前提下,通过压缩手段,使样本数据的间隔合理放大,达到减小计算量,提高测量实时性的目的。

参考文献

[1] hhdxc,魔幻的书包,年轻的花卷,等.一种新型超声波测距系统信号处理方法[J].电子技术应用,2016,42(8):84-86.

[2] zxddg,尊敬的羽毛,聪慧的毛巾.高精度超声波测距方法的研究[J].电气自动化,2015,29(3):112-114.

[3] 背后的朋友,ssdxlz,迷路的心锁,等.超声回波信号调制及其包络相关时延估计算法[J].传感技术学报,2006,19(6):2571-2577.

[4] zxdmla,mldbm,李军怀.超声回波信号包络相关时延估计优化算法[J].计算机工程与应用,2012,48(20):156-157.

[5] hsdxmt,klddg.超声波测距信号处理算法研究[J].福建电脑,2009,25(3):73-74.

[6] 迷你的向日葵,bmdxf,发嗲的羽毛.超声波测距回波信号处理方法的研究[J].测控技术,2008,27(1):48-49.

[7] jmdbm,犹豫的狗.基于STM32单片机的高精度超声波测距系统的设计[J].电子设计工程,2011,15(48):76-78.

[8] BREIMAN L.Random forests[J].Maching Learning,2001,45(1):5-32.

[9] 凶狠的百合,crdxs.四种聚类方法之比较[J].微型机与应用,2010,29(16):1-3.

[10] ssdjz,cjdjy,yxdhb.决策树算法的研究与应用[J].计算机技术与发展,2010(1):114-116,120.

[11] KULKARNI V K,SINHA P K.Random forest classifiers:A survey and future research directions[J].International Journal of Advanced Computing,2013,36(1) :1144-1153.

[12] ladyl,ygdby.信号与系统[M].北京:清华大学出版社,2017.

作者信息:

smdhb,ladyl

(长安大学 信息工程学院,陕西 西安710054)

云原生HTAP数据库加速业务升级—UCloud Serverless分布式NewSQL数据库TiDAndroid编程自定义Notification实例分析React中DOM事件和状态怎么绑定MySQL主从切换怎么实现UCloud AIoT防疫一体机入选工信部“2021年新型信息消费示范项目”Docker如何安装jenkins实现微服务多模块打包java包装类
警戒线和行动限(警戒线和纠偏限怎么算) 多核高速处理器(麒麟659是哪一年的处理器)
相关内容