基于随机森林组合模型的驾驶人分心状态判别研究

发表时间:2020/12/21   来源:《科学与技术》2020年22期   作者:张辉 李晨 李萍 李思颖
[导读] 驾驶人分心状态判别是分心驾驶预警系统的重要基础。
        张辉1 李晨2 李萍3 李思颖1
        1. 中国铁道科学研究院集团有限公司  运输及经济研究所,北京  100081;2.中国铁建投资集团 ,北京  100855;3. 北京交通大学海滨学院 经济管理学院,黄骅 061199
        摘要:驾驶人分心状态判别是分心驾驶预警系统的重要基础。为了探寻驾驶人分心判别方法,本文通过设计模拟驾驶实验,采集正常驾驶状态和执行语音短信次任务时的驾驶绩效指标和驾驶人视觉特征指标,通过ReliefF算法筛选出重要度较大的10个指标作为驾驶人分心状态判别指标,将这些指标作为随机森林组合模型的输入,建立基于随机森林组合模型的驾驶人分心状态判别模型。结果表明,本文建立的模型可以准确判别驾驶人分心状态,判别准确率为82.69%。与决策树C4.5和BP神经网络算法相比,随机森林组合算法在准确率、精准率、召回率、F1值和ROC曲线等模型性能方面均优于其他两种方法。本文所建模型能够有效地判别驾驶人分心状态,可为驾驶人分心预警系统和分心控制策略提供依据。

        关键词:交通工程;分心状态判别;ReliefF算法;随机森林算法;
中图分类号:U491                  文献标志码:A

0 引言
        随着车载信息设备和移动终端设备的日益普及,驾驶员分心成为交通安全的重要因素。一项来自美国警察部门的研究报告表明,2013年中有18%的死亡事故和5%的受伤事故与驾驶人开车时使用手机有关[1]。McEvoy等(2006)也证明了在发生事故前使用手机通话超过10分钟,发生碰撞事故的风险是正常驾驶的4倍[2]。因此,研究驾驶人分心对驾驶安全的影响,构建驾驶人分心状态判别模型对驾驶人分心状态进行判别,对于开发驾驶人分心预警系统,减少驾驶人分心带来的安全隐患具有重要的意义。
        在诸多导致驾驶人分心的驾驶次任务中,使用手机发送短信被认为是最危险的行为[3]。已有研究表明驾驶过程中编辑短信会严重影响驾驶安全、增加事故风险。Cooper等(2011)研究阅读和编辑短信对驾驶绩效的影响,结果表明当开车时阅读或编辑短信时会增加驾驶人反应时间、削弱车道保持能力、降低车速稳定性、增加视线偏离前方道路比例、遗漏更多关键信息[4]。Rouzikhah(2013)研究发现在驾驶过程中甚至读一条很简短的信息也会导致遗漏关键事件,特别是在关键环境中。很多驾驶人认为使用语音短信会比手动编辑短信更加安全,但是研究结果表明语音短信和手动编辑短信对驾驶人的影响都很大[5]。Yager(2013)研究了语音短信和手动编辑短信对驾驶安全的影响,结果表明无论在哪一种短信方式下,驾驶人反应时间都是基准状态的2倍,道路前方的注视点集中度下降[6]。He(2014)研究是在跟车场景中的控制文字输入任务中对比语音短信和手动编辑短信的影响,结果表明语音短信和手动编辑短信相对于基准都会影响驾驶绩效[7]。
        驾驶人分心驾驶状态与正常驾驶状态在生理信号、驾驶绩效、眼动特征等方面存在显著的特征差异[8-10],对这些特征的研究是进行驾驶人分心判别的基础。对于生理信号特征,脑电、皮电和心率表现出良好的识别效果,但是由于基于生理信号的监测方法受限于设备笨重、侵入性强,难以在实际中使用。驾驶人眼动特征被认为是反应驾驶人注意力状态的重要信息,与正常驾驶状态相比,分心驾驶状态在注视(fixation)、眼跳(Saccade)和眨眼(Blink)三个方面都有较为明显的变化,如眨眼次数增加、长时间注视次数增加、注视点分布变化等[11-12]。驾驶绩效主要体现在对车辆的横向控制和纵向控制能力,分心驾驶状态下的驾驶人会出现大幅度车速变化、车道偏离、跟车距离增加等现象[13-15]。眼动特征和驾驶绩效在驾驶人分心状态判别领域方面具有良好的应用。
        目前国内外关于驾驶人分心状态判别的研究多采用单一数据源。例如,Wollmer等人(2011)[16]提取方向盘转角、油门位置、速度、车头朝向、横向偏离和车头转向六个驾驶绩效指标,采用LSTM神经网络对驾驶人分心状态进行判别。马艳丽等人(2017)采集驾驶绩效数据(方向盘转角和转速、横向位移、加速度和速度等),采用SVM分类算法构建了基于驾驶绩效的IVIS操作分心判定模型[17]。对于多源数据源的使用虽然相对较少,但是还是取得了一定成果。例如,Liang等人(2013)在采集眼动时间指标(眨眼频率、注视时间标准差、眼跳时间标准差、眼跳速度等)、眼动空间指标(注视点横纵坐标均值和标准差)和驾驶绩效指标(方向盘转角偏差均值、方向盘位置标准差、车道偏离标准差)的基础上,建立了基于分层策略DBN模型的驾驶人分心状态判别方法[18]。
        虽然国内外对于驾驶人分心状态判别做了大量的研究,但是由于使用的特征指标和驾驶环境不同,不同研究成果之间可比性较差,并没有出现普遍适用性的指标。因此,本文通过模拟驾驶实验平台尽可能多地采集表征驾驶人分心状态的指标,对基数庞大的备选特征集,采用特征选择算法进行优化选取,以提取适用性更强的指标作为分心状态特征指标。此外,在实际应用中,应该采用检测方便、检测方法简单的计算模型,随机森林组合算法是一种基于集成思想的算法,可以获得比单一算法更加优越的泛化能力。因此,本文在现有研究基础上,针对驾驶过程中收发语音短信任务,设计驾驶模拟实验,在采集大量驾驶绩效和驾驶人眼动特征指标的基础上,采用ReliefF算法提取能够表征驾驶人分心状态的指标作为驾驶人分心状态判别指标,利用随机森林组合算法对驾驶人分心状态进行判别,并利用实验数据验证模型的有效性。期待为驾驶人分心预警系统、驾驶人安全管理培训和交通安全管理法规的制定提供理论依据。
1  实验方法
1.1实验条件
1.1.1实验设备
        本文实验利用动感型汽车模拟驾驶器(QJ-4B1型6自由度模拟驾驶器)。该驾驶模拟器主要由硬件部分和软件部分组成。硬件部分包括:比亚迪整车驾驶舱、6自由度车辆动感平台、视景系统、180°柱形投影、音响系统和操作控制平台。软件部分包括:虚拟现实开发平台(Evariste)、三维场景仿真设计软件(3DMAX)和场景控制软件(SCANeR DT)。本实验采用的眼动设备为德国SMI公司生产的Iview X HED型眼动仪。驾驶模拟器硬件平台部分和眼动设备如图1所示。除了上述设备外,实验还需要两部智能手机用于执行驾驶次任务。模拟驾驶器和眼动仪采集频率分别为30HZ和200HZ。


1.1.2实验场景设计
        实验模拟双向四车道的城市快速路,道路长度为17km,车道宽度为3.5m,限速80km/h。为避免其他因素干扰,道路采用全封闭设计,无红绿灯和进出口。在实验中,被试人员驾驶实验车辆(主车)跟随前方引导车做跟车运动,不允许超车和变道,要求与引导车辆保持合适的安全距离。在主车行进方向,只有主车和前方引导车两类车,在对向车道会随机出现少量车辆,对行进方向车辆无影响。考虑到实际中城市快速路车辆速度和模拟驾驶环境中的车辆跟随能力,引导车设定车速为65千米/小时。为了减少学习效应,设置引导车车速产生小范围波动,以模拟引导车随机加减速现象。被试人员在驾驶过程中除了执行正常的跟车任务之外,在某个特定时间段内还需要执行一次语音短信驾驶次任务。
1.1.3驾驶次任务设计
        本实验采用的驾驶次任务是通过装载在手机里的微信软件接收和发送语音短信,参考已有文献[19]中的设计,语音短信内容采用计算两位数加减法的题目,例如15+23=?。在收发语音短信任务,实验中被试将手机切换到微信语音聊天状态并放置于驾驶座右侧,实验人员在一定距离外通过发送微信语音信息对被试进行提问,要求被试接听并尽快回复语音信息。实验人员向被试一共发送5道题目,要求收到被试回复信息之后再进行下一道题目的发送,若被试超过10秒未发送回复信息则进行下一道题目。
1.1.4 被试人员
        实验共招募53位被试进行模拟驾驶实验,所有驾驶人均持有有效驾照,年龄在26~59岁之间(均值:37.7,标准差:8.51),驾龄为3~39年(均值:12.1,标准差:9.34),累计行驶在0.5~400万千米之间(均值:64.2,标准差:94.63)。被试者身心健康,无视觉和听觉障碍,右手利,未饮酒或服用药物。
1.2实验流程
        驾驶模拟实验的流程如下:
        (1)被试人员到达实验室,由实验人员向被试介绍实验大体要求,并要求被试人员在知情同意书上签字;
        (2)被试人员填写年龄、性别、驾龄等基本信息;
        (3)每位被试人员都进行大约10分钟的适应性训练,以适应驾驶模拟环境和熟悉驾驶次任务操作;
        (4)被试人员戴上眼动仪,并进行眼动设备的标定;
        (5)被试人员正常驾驶任务和分心驾驶任务;
        (6)收集和整理数据和视频录像。
1.3数据采集
        实验中共采集了两大类原始数据:驾驶绩效数据和眼动特征数据。驾驶绩效包括车辆的纵向运动行为和横向运动行为,眼动特征包括驾驶人眨眼行为、注视行为和眼跳行为等视觉特征。参考国内外已有研究成果[17-19],最终选取29项指标作为驾驶人分心状态判别指标备选集。所选取的具体指标描述如表1所示。

2  基于ReliefF算法的判别指标选取
        本文采用ReliefF算法对备选集指标进行重要度排序,选择重要度较大的指标作为模型的判别指标。ReliefF算法是一种特征选择算法,根据各个特征与分类标签的相关性赋予特征不同大小的权重,当权重值小于某个阈值时将被移除,说明该特征对模型分类的作用比较小,其中相关性是基于特征对近距离样本的区分能力。ReliefF算法伪代码如下所示:
        假设训练集为,样本抽样次数为,特征权重阈值为,最近邻样本个数,输出结果为各个特征的权重值。
        Step1:设置所有特征的初始权重值为0,为空集
        Step2:计算每个特征的权重值
                for i=1 to m
                 (1)随机抽取一个样本
 (2)从的同类样本集中找出的个最近邻,从每一个不同类中样本集找出个最近邻
                (3)更新每一个特征的权重值

       
        从表2可以看出,按照指标重要度进行排序,排在前10位的指标分别是:瞳孔直径、扫视速度均值、扫视速度标准差、眨眼持续时间均值、注视持续时间均值、注视持续时间标准差、扫视持续时间均值、跟车距离标准差、扫视峰值速度均值、扫视峰值速度标准差。本文选取重要度排序前10位的指标作为驾驶人分心判别模型的输入指标。
3  随机森林驾驶人分心状态判别模型的构建方法
        随机森林算法(Random Forests, RF)是Breiman于2001年提出的一种基于CART (classification and regression tree)决策树组成的组合分类模型,融合了随机子空间思想和Bagging思想,是一种有监督学习算法。 随机森林算法是一个包含多个决策树的分类算法,这些决策树采用随机形成的方法,因此也叫做随机决策树,由这些随机决策树构成了随机森林,随机森林里的决策树之间无关联。当测试数据进入随机森林时,其本质是让每一棵决策树进行分类,最后将所有随机决策树分类结果最多的那类为最终的结果。基于随机森林组合算法的驾驶人分心状态判别的具体实现流程图如下:

图2 基于随机森林组合算法的驾驶人分心状态判别流程
Fig.2 Identification Progress of Driver Distraction States Based on Random Forest
        如图2所示,利用模拟驾驶实验平台采集到的驾驶人分心状态判别指标数据,基于随机森林组合算法的驾驶人分心状态判别流程如下:
        Step1:对驾驶人状态训练集数据利用Bootstrap抽样法对数据进行抽样,有放回地随机抽取n个新的样本集,构建n棵决策树组成的随机森林,一般;
        Step2:驾驶人分心判别特征指标是由ReliefF算法筛选出来最重要的前10个特征,在每棵决策树的每个节点处从输入的10个特征中随机抽取个特征,然后以这个特征中最好的分裂方式对该节点进行分裂;
        Step3:每棵决策树都完整生长,不进行剪枝;
        Step4:对于测试集数据,利用每个决策树进行测试,得到对应的分类类别;
        Step5:采用投票的方式,将n棵决策树中输出最多的类别作为测试样本的判别结果。
        随机森林组合算法中决策树的构建是模型的核心,决策树的棵树直接影响随机森林组合算法的运算效率和分类效果,因此决策树的棵树至关重要。若决策树的棵树太多,会导致算法运行效率降低;若决策树的棵树太多,则会导致模型的判别准确率降低。
4  模型结果与分析
        本文采用ReliefF算法筛选的重要度排序中前10个指标作为驾驶人分心判别特征指标。实验中共选取15267组样本数据,将数据随机划分为70%训练集和30%测试集,驾驶人正常驾驶状态和语音短信状态分别标记为-1和+1。本文采用随机森林组合模型对驾驶人分心状态进行判别。为了减少决策树棵数随机性的影响,进行以下处理:当决策树棵数确定后,建立100个随机森林模型,然后取其准确率的平均值,作为当前决策树棵数下随机森林组合算法的分类准确率,结果如图3所示。

图3 决策树数量对模型性能影响
Fig.3 Influence of Decision Tree Number on Model Performance
        从图3可以看出,针对驾驶人分心状态判别数据,随着决策树棵数的增加,随机森林组合算法的分类准确率有所增加。但是当决策树棵数超过250棵以后,分类准确率基本保持稳定,当决策树棵数为750棵时,模型分类准确率最大。因此,本文随机森林组合模型中的决策树棵数选择为750棵,此时模型判别准确率最高,为82.69%。
        模型判别准确率虽然最为常用,但是只是衡量了分类正确样本占总样本的比例,并不能反应出模型其他性能。对于二分类问题来说其分类的所有结果可以用混淆矩阵来表示,如表3所示。

        为了进一步验证模型的性能,将模型与决策树C4.5算法和BP神经网络算法进行对比,其中BP神经网络算法参数设置为:网络结构为10-15-1,迭代次数1000次,训练精度0.1,学习率0.1。利用上述3种方法对训练集进行训练,并对测试集进行测试,采用准确率 (Accuracy)、精确率(Precision)、召回率(Recall)、F1值(F1-Measure)和ROC曲线对三种模型的性能进行评价。上述运算过程均在MATLAB2013b中编程实现。三种模型ROC曲线图如图4所示。

图4 各模型ROC曲线图
Fig.4 ROC Curve of Classification Methods
        三种模型性能评价结果如表4所示。
表4 分类算法模型性能评价指标
Tab.4 Performance Evaluation Indicators of Classification Methods

        从图4和表4可以看出,相对于C4.5算法和BP神经网络算法,随机森林组合算法准确率、精准率、召回率和F1值均最高,但是运算时间BP神经网络最短(12s),随机森林组合算法次之(27s)。但是综合模型各项性能指标,随机森林组合模型性能最好,分类准确率为82.69%,可以有效地区分驾驶人正常状态和分心状态。
5 结语
        本文设计模拟驾驶实验,分别采集正常驾驶和执行语音短信两类状态下的驾驶绩效指标和驾驶人视觉行为指标,采用ReliefF算法对29个备选集指标进行重要度排序,最终选择重要度最高的前10项指标,作为驾驶人分心状态判别特征指标,利用随机森林组合算法对驾驶人分心状态进行判别,结果表明,当决策树为750棵时,模型判别准确率最高,为82.69%。与决策树C4.5和BP神经网络相比,本文建立的基于随机森林组合算法的驾驶人分心状态判别模型性能较好,可以有效地进行驾驶人分心状态判别。
参考文献:
References:
[1] Overton T L, Rives T E, Hecht C, et al. Distracted driving: prevalence, problems, and prevention[J]. Int J Inj Contr Saf Promot, 2014, 22(3):187-192.
[2] Mcevoy S P, Stevenson M R, Woodward M. The impact of driver distraction on road safety: results from a representative survey in two Australian states[J]. Injury Prevention Journal of the International Society for Child & Adolescent Injury Prevention, 2006, 12(4):242.
[3] Lansdown T C. (2012). Individual differences and propensity to engage with in-vehicle distractions - A self-report survey. Transportation Research Part F Traffic Psychology & Behavior, 15(1):1-8.
[4] Cooper J, Yager C, Chrysler S T. An Investigation of the Effects of Reading and Writing Text-Based Messages While Driving[J]. Proceedings of the Human Factors & Ergonomics Society Annual Meeting, 2011, 56:2196-2200.
[5] H Rouzikhah, M King, A Rakotonirainy. Examining the effects of an eco-driving message on driver distraction[J]. Accident; analysis and prevention, 2013, 50(2):975.
[6] Yager C E. An Evaluation of the Effectiveness of Voice-To-Text Programs at Reducing Incidences of Distracted Driving[J]. Smartphones, 2013.
[7] He J, Chaparro A, Nguyen B, et al. Texting while driving: is speech-based text entry less risky than handheld text entry?[J]. Accident; analysis and prevention, 2014, 72:287.
[8] Calvi A, Benedetto A, D'Amico F. Effects of mobile telephone tasks on driving performance: A driving simulator study[J]. Advances in Transportation Studies, 2011, 26(26):29-44.
[9] Haque M M, Washington S. The impact of mobile phone distraction on the braking behaviour of young drivers: A hazard-based duration model[J]. Transportation Research Part C Emerging Technologies, 2015, 50:13-27.
[10] Horrey W J, Lesch M F, Garabet A, et al. Distraction and task engagement: How interesting and boring information impact driving performance and subjective and physiological responses[J]. Applied Ergonomics, 2017, 58:342-348.
[11] 马勇, 付锐, 王畅,等. 视觉分心时驾驶人注视行为特性分析[J]. 中国安全科学学报, 2013,23(5):10.
MA Yong, FU Rui, WANG Chang, et al. Analysis of Drivers' Gazing Behavior during Visual Distraction [J]. China Safety Science Journal, 2013, 23(5):10..
[12] Liang Y, Lee J D. Combining cognitive and visual distraction: less than the sum of its parts[J]. Accident Analysis & Prevention, 2010, 42(3):881-890.
[13] Haque M M, Washington S. Effects of mobile phone distraction on drivers’ reaction times[J]. Journal of the Australasian College of Road Safety, 2013, 24(3):20-29.
[14] 马勇, 石涌泉, 付锐,等. 驾驶人分心时长对车道偏离影响的实车试验[J]. 吉林大学学报:工学版, 2015, 45(4):1095-1101.
   MA Yong, SHI Yong-quan, FU Rui, et al. Impact of Driver’s Distracted Driving Time on Vehicle Lane Departure [J]. Journal of Jilin University: Engineering and Technology Edition, 2015,45(4):1095-1101.
[15] Carsten O, Brookhuis K. Issues arising from the HASTE experiments[J]. Transportation Research Part F Psychology & Behaviour, 2005, 8(2):191-196.
[16] Wollmer M, Blaschke C, Schindl T, et al. Online Driver Distraction Detection Using Long Short-Term Memory[J]. IEEE Transactions on Intelligent Transportation Systems, 2011, 12(2):574-582.
[17]马艳丽, 顾高峰, 高月娥,等. 基于驾驶绩效的车载信息系统操作分心判定模型[J]. 中国公路学报, 2016, 29(4):123-129. [MA Y L, GU G F, GAO Y E, et al. Driver Distraction Judging Model Under In-vehicle Information System Operation Based on Driving Performance [J]. China Journal of Highway and Transport, 2016, 29(4):123-129.]
[18] Liang Y, Lee J D. A hybrid Bayesian Network approach to detect driver cognitive distraction[J]. Transportation Research Part C, 2014, 38(1):146-155.
[19] Li X, Yan X, Wu J, et al. A rear-end collision risk assessment model based on drivers’ collision avoidance process under influences of cell phone use and gender—A driving simulator based study[J]. Accident Analysis & Prevention, 2016, 97:1.
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: