王旭 马菲 廖小棱 蒋佩玉 张伟 王芳

WANG Xu, MA Fei, LIAO Xiaoling, JIANG Peiyu, ZHANG Wei, WANG Fang. Feature Selection for Recognition of Driving Styles Based on Multi-Classification and Supervised Learning[J]. Journal of Transport Information and Safety, 2022, 40(1): 162-168. doi: 10.3963/j.jssn.1674-4861.2022.01.019
doi: 10.3963/j.jssn.1674-4861.2022.01.019

山东省重点研发计划项目 2020CXGC010117

山东省交通科技计划项目 2021B60



  • 中图分类号: U491.6

Feature Selection for Recognition of Driving Styles Based on Multi-Classification and Supervised Learning

  • 摘要:

    交通事故与驾驶风格具有强烈的相关性,而驾驶风格的直观体现是驾驶行为。为深入分析驾驶行为与驾驶风格的关联性,探索不同驾驶风格群体之间的差异,筛选驾驶风格分类与识别影响因素,建立驾驶风格识别模型并验证有效性。依托车联网实验数据,利用K-means++算法对驾驶员样本数据集进行驾驶风格聚类,设计支持向量机-递归特征消除(SVC-RFE)与随机森林-递归特征消除(RF-RFE)算法进行驾驶特征重要度排序,利用筛选出的特征指标搭建神经网络驾驶风格识别模型。结果表明:①特征个数n = 6时,2种特征排序算法的排序正确率均高于85%,其中RF-RFE的正确率可达90%;②特征排序中重要度最高的指标为最大速度,其在3种驾驶风格群体中的差异可达10 m/s;③仅以最大速度作为输入,驾驶风格识别模型精度为86.1%,表明最大速度可有效区分驾驶风格。


  • 图  1  主成分贡献率图

    Figure  1.  Principal Component Contribution Rate

    图  2  特征个数与交叉验证正确分类分值

    Figure  2.  The Number of Features and The Correct Classification Score of Cross Validation

    图  3  最大速度区间

    Figure  3.  Maximum speed interval diagram

    图  4  平均速度区间

    Figure  4.  Average speed interval diagram

    图  5  测试样本测试结果

    Figure  5.  Test sample test results

    表  1  驾驶风格量化指标集

    Table  1.   Driving style quantitative index set

    序号 评价指标 序号 评价指标
    1 平均车速/(m/s) 10 最小横向加速度/(m/s2
    2 最大车速/(m/s) 11 平均垂向加速度/(m/s2
    3 最小车速/(m/s) 12 最大垂向加速度/(m/s2
    4 速度标准差/(m/s) 13 最小垂向加速度/(m/s2
    5 平均纵向加速度/(m/s2 14 平均偏航率/((°)/s)
    6 最大纵向加速度/(m/s2 15 偏航率标准差/((°)/s)
    7 最小纵向加速度/(m/s2 16 纵向冲击度平均值/(m/s3
    8 平均横向加速度/(m/s2 17 垂向冲击度平均值/(m/s3
    9 最大横向加速度/(m/s2 18 行程距离/m
    表  2  各主成分的信息贡献率与累积贡献率

    Table  2.   Information Contribution Rate and Cumulative Contribution Rate of Each Principal Component  单位: %

    主成分 信息贡献率bj 累积贡献率α
    第1主成分 24.2 24.2
    第2主成分 21.9 46.1
    第3主成分 15.0 61.1
    第4主成分 12.5 73.6
    第5主成分 7.4 81.0
    第6主成分 4.0 85.0
    表  3  驾驶员主成分得分

    Table  3.   Driver principal component score

    样本1 -0.147 -0.738 -1.055 -1.664 -10.172 6.380
    样本2 0.097 -0.814 -0.964 -1.235 -2.273 2.066
    样本241 -2.667 0.165 4.557 -0.116 -9.724 2.030
    样本242 0.325 2.938 3.062 2.356 -13.067 8.413
    表  4  各指标的因子载荷量

    Table  4.   Factor load of each index

    指标1 -0.399 -0.005 0.007 0.875 -0.015 0.001
    指标2 -0.559 0.420 -0.133 0.608 0.237 -0.034
    指标3 0.309 -0.565 0.275 0.508 -0.291 -0.169
    指标4 -0.428 0.676 -0.220 -0.014 0.436 0.006
    指标5 0.246 -0.284 -0.513 0.240 0.023 -0.137
    指标6 -0.389 0.510 -0.412 -0.059 -0.342 -0.253
    指标7 0.394 -0.525 0.256 0.170 0.404 0.254
    指标8 0.705 0.639 -0.005 0.210 -0.175 -0.022
    指标9 0.696 0.646 -0.010 0.218 -0.172 0.003
    指标10 0.710 0.632 0.000 0.208 -0.173 -0.049
    指标11 0.669 0.404 0.114 0.225 0.356 -0.100
    指标12 -0.178 -0.357 0.112 0.047 0.151 -0.836
    指标13 0.586 -0.228 0.279 0.127 0.493 -0.083
    指标14 -0.371 0.384 0.653 0.007 0.033 -0.084
    指标15 0.131 0.515 -0.212 -0.497 0.369 -0.184
    指标16 -0.335 0.366 0.841 -0.075 -0.048 -0.018
    指标17 0.228 -0.262 -0.833 0.040 0.106 -0.008
    指标18 -0.647 0.185 -0.226 0.392 0.165 0.194
    表  5  K-means与K-means++聚类效果

    Table  5.   Clustering effect of K-means and K-means++

    方法类型 聚类数K 迭代次数 轮廓系数
    K-means 3 16 0.339 4762
    K-means++ 3 16 0.349 6989
    表  6  SVC-RFE与RF-RFE排名前6的特征及重要性分值

    Table  6.   Top 6 characteristics and importance scores of SVC-RFE and RF-RFE

    特征变量 重要度分值 特征变量 重要度分值
    平均纵向加速度 4.979 最大速度 0.086 7
    垂向加速度平均值 2.290 最小垂向加速度 0.021 0
    速度标准差 1.786 最小纵向加速度 0.020 5
    最小纵向加速度 0.909 速度标准差 0.014 6
    最小垂向加速度 0.706 距离 0.012 9
    最大速度 0.207 平均速度 0.009 0
  • 收稿日期:  2021-09-23
  • 网络出版日期:  2022-03-31


