张敏 郭慧鑫 田慧芳 王亚宁 张鑫
北方自动控制技术研究所,山西省 太原市 030000
摘要:随着现代化技术以及信息化手段的高速发展,各类科学技术已经得到了较为完善的发展优化,使得自然语言处理技术与语言深度计算得到了越来越多的重视,其作为一种全新的语言能力,在当前的社会环境中已经成为一种前沿的技术手段,将这种自然语言处理技术以及语言深入计算有效融入到群众的日常学习以及日常研究当中,能够更好的提升整体效率以及水平。因此,文章首先对自然语言处理技术的基础展开深入分析;在此基础上,提出计算语言学发展的制约因素,以求为自然语言处理技术与语言深度计算的未来发展奠定坚实基础。
关键词:自然语言处理技术;语言深入计算;深入分析
引言:语言能力属于人类的一种重要能力,不仅是综合能力当中的关键组成部分,同时也是展现综合能力以及运用综合能力的一种重要措施。人类在成长发展过程中,其都在不断的学习各类语言以及知识内容,这也使得正常人能够很自然的掌握生活当中所使用的口语,但读写能力以及第二语言的听说读写能力,都需要进行针对性的学习。而语言能力中,其所需要重点关注的领域就在于机械的语言能力,简单来说,就是机械对人类语言进行理解以及运用的能力,也就是自然语言处理技术,并且在语言能力中,还囊括了运用机械语言的能力,也就是将自然语音处理技术应用在日常生产以及日常学习之中的能力,举例说明,在互联网之中的在线翻译系统内部,能够实现不同语言之间的互相翻译,这就属于一种应用实例,相应的语言信息产业也能够将这部分自然语言处理技术转变为生产力,使其成为信息产业以及语音产业的一种分支。
一、自然语言处理技术的基础
自然语言处理技术的基础就在于语言知识库,通常情况下,人与人之间所展开的语言交流相对较为自然,这是由于两者间的交流都是在特定的环境当中所展开的,并且交流双方自身的知识背景也具备着相同的部分,在交流目的等方面也有着相应预设。而当前的计算机技术,其还不能做到像人类一样对语言内容以及环境进行理解,如果将具体的语言作为主要对象,就会产生不同的歧义。举例说明,在“白天鹅飞走了”以及“白天鹅可以看家”这两句话当中,机器需要优先判断的汉字就是“白天鹅”,明确其到底是“白天,鹅”还是“白,天鹅”这是属于最基本的消歧问题,而提升机器语言能力的第一步,就在于强化机器对于各类自然语言歧义的消解能力,在机器翻译系统之中通常都会将各种句子作为主要的处理对象,机器读懂语言句子的表现形式,其主要就在于对句子内部的基本结构进行准确分析。
举例说明,在“同学选举他当班长”以及“顾客认为他是老板”这两个句子当中,机器翻译系统通过系统化的分析后就能得出正确的语法树,就能够给出更加准确的英语译文。而在利用句法规则展开分析的过程中,首先就应当将构成句子的词语作为词性序列,并且这两个句子之间的词性序列一致,也就是“名词动词代词动词名词”,但具体的句法结构却存在差异,这也产生了一种句法结构歧义,而产生这种企业的主要原因就在于句子当中的第一个动词,其所表达出的句法属性存在差异,相应的分析程序如果可以在某个地方获取到这部分知识,就能够更好的消解歧义。而包含语言词汇、语义知识以及句法的语言知识库,其是整体自然语言处理系统各类功能稳定发挥的基础设施,其在质量以及规模方面也对自然语言处理系统的成败产生了直接影响,而为了更好的支持机器语言能力,也使得综合型语言知识库问世,其中涵盖了词组、句子以及词法、句法以及语义等多个层面,能够实现从汉语到多语言方面的辐射,在通用领域进一步深入到专业领域当中[1]。
二、计算语言学发展的制约因素
在计算语言学的发展进程中,对于人类语言机制的理解是主要的制约因素,例如部分机器翻译系统,其在实现不同语言之间的互译方面起到了十分有效的效果,但在对于部分诗歌内容进行翻译时却呈现出明显的不足,web搜索之中的错检以及漏检等问题也经常出现,这就说明当前的计算机在处理自然语言方面存在着较为显著的盲目性。站在实际情况的角度上来看,自然语言处理是计算机在非数值领域当中最早的应用措施,在经过60年左右的发展时间后,尽管其取得了较好的进步,单无论是与其他领域之中的应用形式进行比较,还是与计算机技术自身进行比较,其整体发展速度都呈现出一种较为缓慢的状态,在具体的自然语言理解以及语言深度计算方面还并没有取得突破性的进展。而引发这一问题的主要原因就在于以下三个方面,首先为语言现象无限,但能够进行利用的计算机资源缺比较有限,很容易产生顾此失彼的问题;其次,语言不仅是工具,也是对象,这就使得机器很难对着两个层面的内容进行区分;最后则是机械对于人类语言的具体机制不够了解,由于人类语言机制与大脑之间有着十分紧密的联系,但人类无论是在大脑与语言之间的相互作用方面还是大脑的认知功能方面,其整体了解程度仍旧较低[2]。因此,深入分析大脑工作与计算运算之间存在的差异,也有利于机器语言能力的局限性不断提升。将机器翻译作为主要例子,计算机内容进行翻译的流程主要就是将自然语言的一种表现形式进一步转变为另一种全新的表现形式,计算机能够有效实现这种任务,而计算机内部的逻辑判断功能、储存记忆功能以及高速数值运算功能,实现的前提就在于计算语言学之中所提供出的理论模型。而所谓的语言模型,主要就是根据具体的研究以及应用方面的基本需求,将那些较为复杂的人类语言进行简化处理,并利用形式化方式所得到的的数学模型,并将这一数学模型进行数值化处理,以此来提升自然语言处理技术以及语言深度计算的稳定性[3]。
结论:在当前的社会环境中,针对互联网环境中对于语言信息处理方面的基本需求,也为自然语言处理基础以及语言深度计算技术提供了更加广阔的发展空间,这就需要进一步提升对于这两方面内容的重视程度,明确其中的基础内容以及制约因素,为其未来的可持续发展奠定坚实基础。
参考文献:
[1]林莉.人工智能时代背景下自然语言处理技术的发展[J].电子世界,2020(22):24-25.
[2]马郅斌.基于词联接的自然语言处理改进技术研究[J].科技传播,2020,12(20):145-147.
[3]沈颖彦,马敏燕,张震,王蓓.自然语言处理在网站分类中的应用[J].信息通信,2020(10):132-134.