尼可科技发展（广州）有限公司，广东广州510000--中国期刊网

字体：大中小

首页> 原创作品> 正文

尼可科技发展（广州）有限公司，广东广州510000

发表时间：2020/10/20 来源：《科学与技术》2020年17期作者：林立嫦

[导读] 在现代科技发展的推动下，智能化的产品越来越多的出现在人们的生活中

        林立嫦
        尼可科技发展（广州）有限公司，广东广州510000

        摘要：在现代科技发展的推动下，智能化的产品越来越多的出现在人们的生活中，为其带来了较大的便利。家庭智能音箱作为其中的一种，其应用逐渐广泛。智能音箱最主要的是语音识别技术，这一技术的良好应用，使得智能音箱的便捷性得以充分的发挥。鉴于此，本文对家庭智能音箱及语音识别技术进行了有关分析，以供参考。
        关键词：语音识别；家庭智能音箱；技术
        社会科技的快速发展，使得人们的生活质量在逐步提升，在如今的社会环境下，人们进入到了人工智能时代，生活中应用到的智能产品越来越多。家庭智能音箱是集学习、娱乐、教学等为一体的现代智能化产品，可以为家庭用户提供诸多的服务，而实现这些功能服务最主要依赖语音识别技术。通过语音识别，机器与人之间可以实现更好的交流互动，因而获得了众多用户的喜爱。
1.家庭智能音箱的有关介绍
        家庭智能音箱是一种基于语音识别技术的现代化产品，在家庭中应用所发挥的作用非常多，给人们的生活带来诸多的便利，尤其是在如今的社会发展情况下，智能音箱在家庭中的应用逐渐增多。如今的智能音箱能够实现音乐播放、闹钟设置等基础功能，如果有网络的接入，还能够实现语音电话、上网浏览信息、播放视频等，也可以实现对家庭中智能电器的实时控制。智能音箱还有个性化的服务，根据家庭中使用人员的不同年龄有相应的模式设置，尤其是针对老人及儿童。如今市场上应用比较多的智能音箱有小米AI音箱、小度音箱、天猫精灵等。智能音箱市场的不断扩大，使其竞争也在加剧，智能音箱在外观形态上的差别并不是太大，最主要的是性能上的区别。智能音箱要实现多项功能，通常需要多种技术的支持，用户在输出语音信息后，智能音箱中的麦克风列阵技术会接收信号，然后经过信号加工处理后转换成音箱可以识别的语言，这其中就需要用到语音识别技术。
2.语音识别技术
        家庭智能音箱中的语音识别技术涉及到的学科有多个，技术流程最主要涉及到的有预处理、特征提取、训练识别。
2.1预处理
        用户在向智能音箱输入语音信号时，通常包含外界环境中的杂音，这会影响到设备的正确识别，所以，在对语音信号进行识别前，需要进行预处理，将伴随语音信号中的杂音剔除。语音信号在一次输入时，往往频率会保持在一定的范围内，利用杂音与目标语音信号之间频率范围的差异，将杂音信号过滤掉，然后将语音信号转变为数字信号。杂音信号的功率与目标语音信号功率相比要大，为了能够使目标语音的区分更加容易，需要使用预加重处理，使目标语音的振幅得到提高，这样在区分时就能更方便。在预处理工作中，一项重要的内容是端点检测，语音信号的输入是分段进行的，而环境杂音是一直存在的，利用端点检测主要是将语音信号的起点位置明确。在进行端点检测时，最主要使用到的方法有短时平均过零率和短时平均幅度。在已有的语音识别软件中，语音截取的方式主要有两种，一种是利用特定的按键进行手动收集语音信号，这一种一般在手机中使用。另一种是自动收集语音信号，在目前已有的智能音箱中使用这种方式，由于这种方式容易在精准度上产生差异，因此，通常都是设定要在特定的语音信号后才开始进行语音信号截取。比如小度智能音箱，模式就是小度小度+语音信息，这样可以避免杂音信号的影响。

期刊文章分类查询,尽在期刊图书馆

2.2特征提取
        在语音信号被收集后，就需要做特征提取，这一部分的工作主要是将输入的语音信号划分为若干个区段，提取出其中具有应用意义的特征参数，然后统计起来。经过特征提取的语音就是一段信号，将其中没有意义的区段去掉，也就相当于对信号数据的精简，可以使信号在转化处理时便于更好的计算。进行语音信号的特征提取，需要使用隐马尔科夫模型，对语音信号中包含的语义进行特征提取。
2.3训练识别
        智能音箱对语音进行精准的识别，需要通过大规模的数据及训练才能够完成。训练识别的网络就好比是计算机，用户则相当于训练师，在经过大量的数据统计计算分析和训练后，才能够使结果更加得到用户的满意度，从而实现机器与人之间的语言交互。在训练识别网络中，深度学习是非常关键的一环，最主要的特征是进行多层次的计算和信息处理，在一个层次中得到结果后再进入下一层，而上一层的结果作为下一层输入使用，进而完成深度学习，在语音识别中是重要的特征点，经过训练识别网络中的数据对比，然后得到计算结果。
3.智能音箱给人们带来的便利性
        人工智能时代的到来给人们的生活带来巨大的变化，智能音箱在家庭中的应用使得人们的生活效率以及生活方式得到了较好的改善。在智能音箱还没有进入到家庭中时，人们如果要播放音箱，需要手动进行操作，而且很多功能的实现需要多个电器或者电子设备来完成。而智能音箱在应用后，人们只要将自己需要的服务以语音形式传达，音箱就会根据语音信号的识别来完成相应功能。一台家庭智能音箱能够实现教学、娱乐、学习等多方面的功能，推动了人们生活水平的提升。
4.语音识别技术目前困境及未来发展趋势
4.1目前存在的问题
        语音识别技术在智能领域的应用已经较为普遍，但是在技术方面还存在一定的不足，首先是在自然语言方面具有不定性，自然语言不仅仅包括语言本身的含义，还涉及到语言的情境问题，所以就增大了其不确定性。如今人工智能的实现大多都是先经过程序的特定编程，完成计算机能够识别的语言逻辑，然后通过语言信号与数字信号之间的转换才可以对自然语言进行解读。在这一过程中，如果程序编程存在问题，相应理解的自然语言就会出现偏差，由于语法规则有很多，因而在程序编程中还存在一定的不完善。再者，自然语言其中包含的信息非常多，在不同的情境下，所包含的具体含义不同，智能设备无法对语言的具体情境进行掌握，因而就会出现语音识别的偏差。
4.2未来发展趋势
        由于自然语言的不定性及复杂性，在进行语音识别时，要想全面的掌握存在较大的难度，不过以领域进行划分，可以对单一词汇在特定领域下出现的频率进行统计分析，以此建立以特定领域为单位的语音识别系统，这样其使用的精确性和效果就会得到较大的提升。另外，使用动态语义分析方式，由于目前语音识别主要是针对特定语义来分析，缺乏对语境的联系，在未来语音识别技术发展时，可以对用户自然语言的语境进行动态化的分析，结合语义和语境共同对其进行识别，这样机器和人之间的交互才会更加精准。
结束语：
        总而言之，在如今的社会发展环境下，智能音箱在家庭中的应用越来越广泛，基于语音识别技术，人们能够通过输出语音来实现与机器的交互。在目前智能音箱产品的发展中，语音识别系统还存在较大的提升空间，针对目前语音识别系统中存在的不足，相信随着科技水平的不断进步，未来语音识别技术将会更加成熟，在智能产品中的应用水平会进一步提升。
参考文献：
[1]胡益恺. 浅析家庭智能音箱中的语音识别技术[J]. 科技传播, 2019, 011(004):123-124,137.
[2]李沛谕. 语音识别技术在智能音箱系统中的应用技术浅析[J]. 中国新通信, 2018(020):117-118.
[3]王御霏. 家庭智能音箱中计算机电子信息技术的应用[J]. 中国战略新兴产业, 2018, (02X):129-130.
[4]华建勇. 浅议智能家居控制系统中语音识别技术的应用[J]. 数字化用户, 2019, 025(009):78-78.