车载语音控制系统设计

发表时间:2021/6/15   来源:《科学与技术》2021年第6期   作者:沈文跃
[导读] 目前,我国的汽车行业在我国发展十分迅速,为避免驾驶人在驾驶车辆的过程中执行过多的非驾驶行为操作,
        沈文跃
        江苏园上园智能科技有限公司 江苏 常州 213001
        摘要:目前,我国的汽车行业在我国发展十分迅速,为避免驾驶人在驾驶车辆的过程中执行过多的非驾驶行为操作,本文设计了一套集合语言识别和车辆控制的车载语音控制系统.系统中的语音识别模块在接收到驾驶人的命令后,会对声音信息进行处理并将结果发送至主控制器,主控制器则通过CAN通信模块将接收到的命令发送至执行器完成具体操作.文中设计的系统可以让驾驶人在执行驾驶操作的过程中,通过语音命令控制完成一些简单的非驾驶行为操作,从而提高车辆行车安全性,减少交通事故的发生.
        关键词:车载语音控制;智能化;行车安全性;语音识别
        引言
        随着汽车电子智能化、网联化的迅猛发展,车载电子电气系统功能越来越复杂,语音控制系统作为关键技术之一,对用户体验和驾驶安全具有重要影响。搭载语音控制系统,不仅提高了车载智能化体验性和娱乐性,还可以在驾驶过程中实现对车辆的便捷控制。为满足用户需求,当前国内市场主流车型大部分均已配备车载语音控制系统。目前,红旗全系车型也将语音控制系统作为标准配置之一。为实现对红旗系列车型车载语音控制系统的高效功能验证,本文提出一种基于语音仿真和机器视觉的车载语音控制系统自动化验证方案,利用语音仿真和机器视觉技术可实现语音指令仿真输入和测试结果的自动回采,通过编制自动化测试序列,可以实现对车载语音控制系统自动化测试和重复性测试,可有效提升测试效率,提高测试覆盖度,对缩短产品周期和降低开发成本有重要意义。
        1系统总体结构设计
        软件采用开源的Android操作系统。硬件架构包括:ARM主控器、LCD触摸屏及硬件驱动电路、离线语音识别单元和外围硬件模块。其中,车载主控器ARM采用三星的四核处理器,基于Cortex-A9架构的Exynos4412,搭配1GBDDR3运行内存,最高运行主频为2GHz。Exy-nos4412处理器搭载高性能数据处理引擎,为车辆数据信号的收集和处理提供了有利条件。系统采用型号为AT070TN92的可触控LCD显示屏,支持多点触控,分辨率是800×480,响应迅速。显示屏和主控器采用45pin接口直接相连,该可控制行场扫描信号、背光控制信号和使能信号等。离线语音识别单元由微控器STM32F103控制LD3320专业语音识别芯片实现。LD3320是由ICRoute公司设计制造的一款专业、快速且稳定的语音识别芯片,优点是效率高、成本低、无需外围辅助元器件如内存和闪存等、无需驾驶员事前语音训练等,即可实现准确率>95%的单芯片语音识别。此外,可以动态编辑LD3320识别语句,这就为车载环境下语音识别提供了强有力的条件。STM32F103是采用Cortex-M3架构的32位微控器,时钟频率为72MHz,指令执行效率高,响应速度快,成本低。STM32F103通过SPI串行通信控制LD3320,以配置LD3320内部寄存器的方式,传入识别关键字,从而实现识别列表的动态编辑。STM32F103采集LD3320识别结果,通过串口发送到车载主控器。
        2车载语音控制系统设计
        2.1语音模拟输入模块
        测试环境配置NIPXI-4461模拟音频信号发生和采集板卡,结合上位机音频仿真软件和功率放大器仿真语音指令输入,PXI-4461具有如下特性:(1)动态范围118dB;(2)采样率可达204.8kS/s;(3)输出频率可达92kHz。通过分析车载语音控制系统功能模块,编辑标准语音输入文档,并生成标准语音指令库,上位机软件NITestStand直接调用标准指令库中的语音指令,经HIL仿真设备输出至音频发生和采集板卡音频发生通道和功放,实现对人类语音控制指令的仿真。


        2.2硬件电路设计
        硬件电路以ARM为主控制器,包括语音采集电路设计,噪声抑制电路设计,硬件抗干扰电路设计。1)语音采集电路设计包括:采用前置放大器,有源带通滤波器,功率放大器的方案,能有效抑制噪声,以便保证我们开车时注意力不集中时能够清晰的收听,不受干扰。前置放大器:采用小信号放大器。主要是由于在通常情况下,麦克风采集到的信号非常弱,其幅值在毫伏量级,但是共模噪声信号的幅值在伏值量级,两者直接的差值为好几个数量级。因此,需要的前置放大器一定要具有的输入阻抗非常高,共模抑制比非常高,漂移特性低,可以有效的在降低噪声的同时并放大信号。功率放大器:为了带动后面的负载,一般所有电路后端电路都要使用功率放大电路,在本文中采用芯片TDA2003,因为它的功能强大,同时带有保护电路,可以消除电噪,同时输出功率较大,非线性失真较小。
        2.3软件系统设计
        (1)主控制器控制程序设计主控芯片可读取语音模块的数据信息并转换成CAN通信模块可识别的数据.而要识别这些数据首先要初始化各个模块,主要包括LED初始化、LCD初始化、CAN初始化、按键初始化、触摸屏初始化、内部内存池初始化等.串口波特率设置为11520.初始化各个模块后分别对模块的程序进行编写.以LCD为例,想要驱动的是车窗与空调等的开关,并能在连接实物后在初始屏幕上显示车窗与空调的状态.(2)语音控制程序设计语音模块的程序就是当整车CAN网络接收到语音模块的信息后能相应地执行工作,并在LCD屏上显示工作内容.部分控制程序如图4所示.(3)CAN模块控制程序设计CAN通信模块与单片机的具体操作流程为:单片机转换语音模块接收数据后发送给CAN通信模块,再由CAN通信模块发送数据给整车CAN网络通信模块.CAN模块分为普通模式和环回模式,这两种模式均需要进行初始化.整车CAN网络在接收到单片机发送的数据后会根据要求显示在LCD上,并执行数据的接收和发送任务。
        2.4离线语音识别设计实现
        其他任一类型语音识别,都是以中文文本库为匹配对象,语音识别出来的结果是同音字,但不一定是正确识别结果。例如呼叫“王鹏”,就可能识别为“王朋”或“王彭”,这样就可能导致识别失效或者打错电话的尴尬。故采用离线语音识别控制蓝牙电话,将通讯录里联系人的名字设定为离线语音识别匹配库,这样匹配到的结果就是要找的联系人,识别快速准确。LD3320语音识别芯片是通过和写入芯片的关键词对比实现语音识别的。将需要识别的关键词以拼音字符串的形式,写入到微控器的运行内存ROM内部。LD3320进行语音识别时,将语音信号进行分析和特征提取,与关键词列表中的信息进行匹配,相似度最高的即最佳识别结果。考虑到车载语音环境的特性,设计时采用触发识别,即微控器接收到一个外部触发命令(设计为驾驶员的按键命令)时,才会开放LD3320的识别条件,即一次触发进行一个语音识别过程。此外,采用LED灯光提示,提示驾驶员语音识别环境准备就绪,避免驾驶员随性的语音导致识别率降低,会进一步提高语音识别效率,增强驾驶安全性。有语音识别结果时,LED自动熄灭。触发识别还是一种低功耗模式,在驾驶员不操作语音识别时,微控器不控制LD3320工作,以达到省电降耗的功效。
        结语
        车载语音控制系统验证环境具有较高通用性,同一自动化测试序列可应用于系统多轮次重复测试,且全自动化验证环境可实现24小时不间断测试,并自动出具过程文件及测试报告,人力成本和时间成本大幅降低。利用该验证环境可以在研发阶段检验车载语音控制系统各功能模块缺陷项和识别率,有利于研发人员进行针对性改进,保证了车载信息娱乐系统产品质量。
        参考文献
        [1]梁家恩.智能语音入侵未来生活[J].华东科技,2014(10):38-39.
        [2]许铭.车载环境下语音处理关键技术的研究[D].锦州:辽宁工业大学,2019.
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: