汤力 杜洁 李芹 王菁
云南电网有限责任公司信息中心,云南省,昆明市,650217
摘要:近年来人工智能(AI)得到了快速发展,并在若干领域得到了广泛应用。其中,自然语言信息处理就是人工智能领域的一项重要技术。它融合了语言学、计算机学、统计学、大数据等多门技术,进一步提高了人机交互能力。本文首先介绍了自然语言信息处理中包含的核心技术,随后就该技术在语言自动翻译、字符精准识别、文本检索、机器人聊天等方面的智能化应用展开了简要分析。最后基于AI技术、5G技术的发展趋势,对自然语言信息处理的应用前景进行了简单预测。
关键词:自然语言信息处理;智能化;文本检索;同声传译
1.自然语言信息处理的核心技术
自然语言信息处理(NIP)是随着信息时代到来,发展起来的一种新型人机交互技术。其组成技术主要包括基础技术、核心技术和衍生技术三种。其中,基础技术包括词汇分析、句法语义表示、篇章分析等几种。利用基础技术,可以使计算机能够准确识别待处理的文本信息;核心技术包括机器翻译、信息检索、信息筛选、智能对话、语言生成等几种。利用核心技术,可以支持基于自然语言信息处理的机器人聊天系统、信息精准推送等功能的实现。衍生技术包括搜索引擎、语言助手、商业管理等,可以支持自然语言信息处理技术在各个行业的应用。
2.自然语言信息处理技术的智能化引应用
2.1在文本方面的智能应用
2.1.1 语言自动翻译
它涉及到计算机技术、数学建模技术、心理学以及语言学等多个方面的学科。通过近些年的努力已得到了一定的发展。自然语言处理技术已在多个方面提升了翻译的效率和准确性。如自然语言处理中的语言形态分析与歧义分析对翻译技术来说十分重要,可以很好的处理翻译中的多意现象和歧义问题,从而提高翻译的准确性。特别是随着神经网络和人工智能的发展,使得计算机的学习能力得到了大幅度的提升,不仅可以支持一种语言向多种语言的灵活转换,而且还能够在不断学习的过程中,让翻译的准确率得到持续性的提升。
2.1.2 字符精准识别
在信息时代,每天会产生海量的文件,要想从这些海量信息中,快速搜集有价值的信息,必须借助于字符识别技术。字符识别本质上是自然语言信息处理技术在模式识别领域的一个分支,根据其识别流程,可以细分成识别前的字符预处理、识别过程以及识别后的修正处理三个阶段。预处理主要是检查字符的输入是否规范,并且对不符合规范的标记,由人工进行特殊处理。这样一来,可以保证字符识别的准确率。在识别后的修正处理,主要是对于识别不够准确,或是存在歧义的字符,做进一步的处理。既可以实现快速识别,又能够兼顾准确率。
2.1.3 文本检索
从现阶段自然语言信息处理的应用领域来看,文本检索仍然是最为重要的应用,并且可以支持关键词检索,或是全文检索等多种检索形式。通过采用自然语言信息处理技术,一方面能快速分析用户输入信息并进行准确理解为检索提供更加准确的关键词,并且可以扩展检索输入的范围,让其不仅仅局限在文本输入方面,如采用语音输入或基于图像的输入;另一方面,通过采用自然语言信息处理技术可以对搜索到的信息进行处理让用户获取的是更加有效、准确的信息而不是海量的信息源。从实际应用效果上,运用自然语言信息处理后,可以实现精准检索,从而缩小了检索范围,在提高检出速度方面也有积极帮助。
2.2在语音方面的智能应用
2.2.1 机器人聊天系统
机器人智能问答已经广泛的应用于我们的日常生活、工作中。
而自然语言信息处理则是实现人与机器智能交流的关键技术。机器人在接收到人的语音信息后,先进行“语音-文本”的转化,将声音信号转变为计算机可识别的数字信号。然后通过智能处理,从数据库中匹配相关的问题,调用对应的答案,再完成从数字信号向文字信息的转变,并通过人机交互界面展示。在运用自然语言信息处理技术后,机器人聊天系统的响应速度、回答准确率都有了明显的提升。
2.2.2 自动同声传译
自动同声传译主要涉及到语音建模、识别以及语言翻译等方面,采用自然语言处理技术可以对自动同声传译的每个方面都能得到提高,最直接的部分就是语言翻译部分,同时还可能涉及到语音与文本的转换。在语音-文本转换过程中,需要解决的难点是“音似字不同”的情况。使用自然语言信息处理,可以更加精准的辨别发音,提高了转换结果的准确度。另外,像近几年兴起的语音控制技术,本质上也是自动同声传译的一种应用形式,在支持远程控制和智能管理方面发挥了一定的作用。
2.3在其他领域的智能引言
2.3.1 定向推送
精准推送也是自然语言信息处理技术的一种智能化应用。以电力公司为例,在日常的电力营销中,只有保证受众的精准性,才能提高营销成功率,用较低的营销成本,为公司带来最大的效益。自然语言信息处理可以通过关键字匹配技术,实现了信息的定向推送。首先,通过大数据技术,获取用户的一些公共信息,包括历史访问记录、浏览痕迹、检索关键词等。其次,根据上述信息,判断该用户是否为潜在的客户。如果匹配率较高,则向该用户推送本公司的广告或信息。这样就最大程度上避免了无效推送,可以节约营销成本。
2.3.2 信息筛选
在信息时代,信息泛滥成为困扰人们的一个常见问题。但是由于日常生活和工作需要,我们不可能将所有信息屏蔽,如何实现信息的精准筛选和智能过滤,就成为迫切需要解决的问题。自然语言信息处理可以通过文本分类技术,达到这一功能。我们可以通过自定义的方式,根据个人需求,设置过滤条件和筛选范围。然后计算机可以对接收到的文本信息,进行自动分类。将那些符合过滤条件的,或是不在接收范围之内的信息,有计算机自动进行滤除,既可以解决垃圾信息,又不会错失有价值的信息。
3.自然语言信息处理技术的发展前景
在信息化时代,自然语言信息处理技术已经被广泛应用于多个领域,为我们带来了诸多的便利。前端信息技术的发展,能够为自然语言信息处理在更宽广的领域、更深层次的应用提供必要的技术支持。目前来看,随着下一步5G技术、大数据技术、云计算基础,以及深度学习和AI技术的不断成熟,将会让自然语言信息处理在信息筛选与过滤、语音识别和语法检查等方面,发挥更加明显的应用优势。自然语言信息处理的机理,就是通过机器学习和算法处理,实现人与机器之间的交流。而大数据、云计算、AI等技术的成熟,将会进一步提高计算机的深度学习能力和快速学习效率,从而让自然语言信息处理技术的实用价值得到进一步提升。由此可以推断,自然语言信息处理技术在未来将会有更为广阔的应用市场。
结语:伴随着信息技术的发展,自然语言信息处理在多个领域得到了推广使用,加速了日常生活和办公的信息化、智能化发展。从这一技术的应用现状来看,主要集中在语言自动翻译、自动同声传译以及信息定向推送等方面。但是我们也注意到,自然语言信息处理技术也仍然存在不足,例如句法的模糊性、输入的不规范等等。因此,下一步还需要借助于大数据、云计算、人工智能等前沿信息技术,支持自然语言信息处理不断进行深度学习,从而解决当前的弊端,向更好的方向发展。
参考文献:
[1]徐琳宏,丁堃,林原,等.基于机器学习算法的引文情感自动识别研究--以自然语言处理领域为例[J].现代情报,2020(1):46-47.
[2]邓志远.基于自然语言处理的电信系统热点问题的提取[J].信息技术与信息化,2020(12):213-214.
[3]郑浩泉,杨志,孟庆强.基于自然语言处理和层次分析法的物料集采分析[C]//第二届智能电网会议论文集.2018.