语义智能化处理的认知机制

发表时间:2020/9/27   来源:《时代教育》2020年6期   作者:何丽娜
[导读] 传统语言学已经可以帮助人工智能解决一部分初级问题
        何丽娜
        空军工程大学  陕西西安 710051
        摘要:传统语言学已经可以帮助人工智能解决一部分初级问题,但在语义、语用层面仍面临很多困难。要解决这三个方面的问题,需要从语言学范畴去深入了解理解词义的本质,语义的概念构建与表征以及语境对语义的作用。从认知科学的角度看,语言能力是一种认知能力。因此,语言的理解和产出也是认知任务的完成过程。因此探讨语言系统理解自然语言的机制对自然语言中语义的智能化处理能够提供有益借鉴。
        关键词:认知语言学,自然语言,认知科学

一、自然语言处理的现实困境
        自然语言处理是人工智能的一个重要分支,旨在利用计算机工具处理和分析自然语言,以实现人与计算机通过自然语言进行的有效沟通。自然语言处理通常被类比为“语言学范畴+计算模型”。其中语言学范畴是指由语言学家定义的语言学概念和标准(如词、词性、语法、语义角色、篇章结构等),自然语言处理处理的任务大多来源于此,具体实现的计算模型或算法通常由计算机专家研制。
        现有计算机所体现的智能与人类智能的重要区别在于:计算机对语言的处理遗漏了人类在进行语言处理时的意义表征。由于计算机在对语言进行处理时只注意到了语言的形式,所以它无法到达语义的本体。机器翻译还远达不到“信、达、雅”的程度。因此,智能计算机的实现最终将取决于选择合适的描述手段和方法来显现语义的本体,进而形成必要的形式化意义表征,达到真正的人工智能。
        传统语言学已经可以帮助人工智能解决一部分初级问题。但在语义、语用层面仍面临很多困难。自然语言对语义的智能化处理存在的困境有:
        1.    对词义的理解问题。机器理解无法向人脑一样实现对自然语言非快捷的处理流程也无法根据实际情况做出改变。
        2.    对语义概念的表征问题。机器无法向人脑一样通过逐层信息加工自动生成高级的语言学符号及其模式规则。
        3.    对语境变异中词义的自动学习问题。机器无法像人脑一样对词汇的新语境意义进行自动学习和更新。
        要解决这三个方面的问题,需要从语言学范畴去深入了解理解词义的本质,语义的概念构建与表征以及语境对语义的作用。传统语言学对于人脑的语言与思维的研究并不充分。
二、智能条件下的语义认知
        从认知科学的角度看,语言能力是一种认知能力。因此,语言的理解和产出也是认知任务的完成过程。

在第二代认知科学背景下基于体验观发展起来的认知-构式模型重新整合语言科学为把语言研究的不同方面联系起来提供了契机:可以把语言习得视为习得处理具体构式能力的过程;把语言演化视为由大脑的处理和学习偏向所塑造的过程;基于构式的扩散和修正,可以为语言变化和变异提供一个历史性的解释;可以把语言学和建构可操作的电脑语言处理系统联系起来(Christiansen& Chater,2016a)。也因此,认知语言学视角下的语义理解机制对解决自然语言的理解和处理提供了更为有力的理据来源。
        通用的自然语言处理与语言学领域的范畴直接相关。语言学范畴的核心任务在于语义分析。语义分析的目标是通过建立有效的模型和系统,实现在各个语言单位(包括词汇、句子和篇章等)的自动语义分析,从而实现理解整个文本表达的真实语义。语义分析任务是促进其他自然语言处理任务快速发展的基础。以使用为基础研究语言知识内容的角度是认知语言学的一个突出特点(Langacker, 2000; Barlow & Kemmer,2000; Goldberg, 2005; Croft & Cruse, 2004;Diessel, 2004等),也是同主流生成语法的一个重要差别。这种思路有心理语言学试验证据的支持(见Taylor, 2002的有关讨论及所列文献),同时与语言人类学家长期所坚持的关于语言与话语(及文化)相互构建的观点十分吻合(Johnstone,2002:42)。因此认知语法中语言知识的范围比传统看法广, Langacker曾将其描述为最大范围。
三、语义智能化处理的理论路径
        传统的NLP基本上都是在做“处理”的工作,是把人类的语言分解细化,从分词,词性标注,句法分析开始,形成了分词模型、句法树模型,以及命名实体识别,文本摘要等。NLU则解决更深层的“理解”问题,即如何消化NLP已经处理好的知识,真正让机器明白人类语言的语义。
        目前主流自然语言处理的句法分析(句法树)根植于乔姆斯基的句法分析理论,在第二代认知科学背景下受到了前所未有的挑战(董粤章,2010)。随着语言生物机制研究的新成果,即结构基因组学有关FOXP2基因与人类语言能力关系的研究成果,对语言本质的认知以及以使用为基础的认知语法模式和相关理论进一步提供了佐证(董粤章,张韧2009)。
        人工智能的发展,需将认知语言学、心理语言学、社会语言学的研究成果运用到人机对话的设计中,使机器理解“寒暄”、“安抚”甚至是“讽刺”、“幽默”这样的言语修辞行为。以弥补传统自然语言处理在语言理解上的不足,让机器真正读懂人类语言的复杂语义,以及背后的意图和情感,从而给予更为准确的反馈,达到更好的自然语言交互效果。基于体验观的认知语言学认为表征语言的认知结构和人脑的其他认知结构并没有本质差异,同时与人类的具身经验、大脑的构造特点以及社会互动密不可分。体验观下的语言学不承认独立的语言能力或句法模块,概念的语义并非是从字典中罗列的静态含义,事实上,每个人对概念的理解与其个人特异化的体验环境有关。因此,此类研究的重要任务在于对存在巨大分歧的理论进一步梳理,分析,在厘清基本假设,在理论上重新认知的基础上再来分析自然语言的理解与处理。
        
        
        
参考文献:
[1]Ronald W. Langacker, Foundations of cognitive grammar[M].Stanford University Press, 2000.
[2]董粤章,张韧. 语言生物机制研究的新视野:FOXP2与人类语言能力[J].东北大学学报(社会科学版),2009.07.
 
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: