四川凉山彝语阿都话语音资源库建设与运用研究

发表时间:2021/4/26   来源:《文化研究》2021年5月下   作者:王成平 孙某姑
[导读] 目前利用信息化手段保存、传承四川凉山彝语阿都话是目前最为有效、极具价值的保护方式。论文研究按语言调查规范标准化制定《彝语阿都话语音调查文本》,运用语料库、MySQL、Web程序等技术完成凉山彝语阿都话基础语音资源库的建设及基于声学参数库的阿都话元音的分析研究。

四川成都西南民族大学民族语言文字信息处理重点实验室    王成平 孙某姑   610041

摘 要:目前利用信息化手段保存、传承四川凉山彝语阿都话是目前最为有效、极具价值的保护方式。论文研究按语言调查规范标准化制定《彝语阿都话语音调查文本》,运用语料库、MySQL、Web程序等技术完成凉山彝语阿都话基础语音资源库的建设及基于声学参数库的阿都话元音的分析研究。
关键词:彝语;阿都话;语音资源库;声学参数库;元音分析
        1.前言
        彝语北部方言是彝语六大方言之一,彝语阿都话属彝语北部方言南部次方言的东部土语据相关统计截至2010年彝语阿都话使用区人口约为60多万人,阿都话中保存着较多古彝语词汇,仍留存着复元音复辅音的语音特征,词汇表达较为丰富。目前彝语阿都话基础语言工程建设研究尚处于初级阶段,全面性的描写和展示彝语阿都话的原始面貌是彝语方言及其信息化研究的核心要点之一。

图1  彝语阿都话方言分布图
        国内著名民族语言学专家沙马拉毅教授曾谈道:“保护和传承彝语文是我们这代人的历史使命,不能让一种语言消失后再想复活它。”通过语言田野调查对民族语言文化资源进行记录,有效保存、保护处于濒危边缘的阿都话尤为重要,同时建立语音资源库,为研究阿都话提供新的研究方视野。论文开展四川凉山彝语阿都话语音资源库的建设与研究,主要参考、借鉴语言学、应用语言学、实验语音学、语料库等学科视角,对阿都话进行多维度的研究、展示与分析研究。
        2.语音数据采集整理
        2.1 调查文本制定
        论文研究完成的《四川凉山彝语阿都话语音调查文本》主要参考《中国语言资源有声数据库调查手册(汉语方言)》、《中国语言资源调查手册-民族语言(藏缅语族)》以及借鉴《语言调查语料记录与立档规范》;彝语阿都话的语音资源库调查选取进行田野调查的字、词、句、短语、故事等有声语音资源整理进行收集,分析和归纳调查中存在的语音现象。


        调查文本的词汇按照自然词汇层面选词是根据阿都地区所独有的自然环境和农牧业产物进行的选词,如:土豆、荞麦、锄头、耕犁等;根据阿都地区彝族群体的人文文化进行服饰、家具、配饰、农具等多角度的选词,并结合彝族群体的日常生活习惯和文化交流用语,进行了语句和词汇的选定;故事文本选取的内容包括:神话传说、寓言故事、民间类故事等。
        2.2语音数据收集整理
        语音资源数据采集记录是对语言调查并完成采集记录的过程,将采用前期准备的工作要求准则,进行数据的的录入,然后进行语音片段剪切。完成编码、标注和入库。


        3.彝语阿都话基础语音资源库建设与管理
        彝语阿都话基础语音资源库是通过彝语言文字信息化技术结合计算机科学共同制定的一个交互型语音类资源库,其语音数据数字化,其实质是语音数据进行数字化加工并投入资源库使用管理的过程。彝语阿都话的语音数据材料将以实地的语言调查采集获取到的原始采集语音数据为准,加以语音的切分,完成数据的分类归档,完善架构设计,如图1所示:

        3.1 语音资源库规模架构制定
        阿都话语音资源库,采用全局管理模式对整个系统进行科学的布局和管理,通过用户权限的分类限制有效保护数据安全,同时考虑到系统的扩展性,完成数据交互的连接任务,其流程如图2所示:

        2.3语音资源库系统架构
        彝语阿都话语音资源库通过数据库设计方案的架构设定为两个部分:资源库前台和资源库后台。前台进行管理和设计主要实现语音资源库的语音的播放试听、语音标注信息查询、阿都话视频的观览、语音和视频的上传下载等功能。后台设计管理主要用于管理人员的对语音视频的目录、数据信息以及管理员功能权限的控制等功能。
        语音资源库采用自上而下、从总体到局部的管理运行模式。从首页到影像资源再到语音资源的分布结构等都可以进行语音和影像的分类检索,同时可以进行会员管理,进行数据的上传。

        通过系统化的分类,有助于直观的分类界面为资源库管理控制庞大数据量带来方便,实现科学化的管理策略。
        2.4语音库前后台系统规划设计
        彝语阿都话基础语音资源库前台系统主页面包括以下部分:主页上端:主要汇集彝族风格元素的Logo图、搜索引擎、会员注册/登陆、首页导航以及影像资源的定时轮换图。主页底端:包括页面的开发商版权和商标等信息、后台开发技术工作人员的联系方式和其他信息等。
        语音资源库的网页首页是资源库的门户,突出以下几个功能。
        其一,语音资源的检索是数据库建设的核心功能。通过检索,可以在最短时间内查询到需要获取的语音情况,可高效完成数据查询。

        其三,附加信息的查看。通过该模块,可以了解语音数据和影像数据的基础说明。
        语音资源库网页端后台系统规划涉及以下几个内容,其中有目录管理、数据管理、会员管理、上传信息管理和管理员设置,在信息化背景下的民族语言文字的数字化建设,科学的部署和分配数据资源有着重要意义。
        2.5系统开发重点难点分析
        (1)资源库访问
        阿都话语音资源库的是基于交互使用的数据资源库,阿都话语音资源库会员用户登陆本地链接地址为:http://localhost/adu/indeph*p,阿都话语音资源库管理员登陆本地链接地址为:http://localhost/adu/admin/indeph*p,可将资源库依托外挂网站挂载,实现数据上传,互联网客户端的访问。
        (2)检索功能。
        实现全局分类检索功能,利用MySQL中的全文搜索match against命令,通过数据表,利用相关的命令函数标识字段,结合创建索引命令实现索引的处理。
        (3)数据上传、下载
        数据资源的上传即管理员将数据文件进行上传服务,通过上传功能将数据上传到服务器端。实现对函数数组中数据的值的验证。
        (4)PDO技术分析
        PDO是PHP中一个比较重要的扩展功能,激活过程便是编写php.ini文件,并添加扩展任务命令,完成跨平台的数据迁徙。
        4.基于语料库的彝语阿都话声学参数库建设与元音分析
        4.1声学参数库建设
        论文研究主要参照“少数民族语音声学参数数据库”的规范参数标准和要求,完成声学参数库的建立,流程思路如6图所示:

        阿都话语音参数库以阿都话的单音节词、多音节字共同组成,在参数库中单音节词在数量上所占比例较大(63%),主要使用单音节词进行数据分析,其提取数据较为可靠;同时每个词都用国际音标标注,并标注准确的汉译文;经过系统化甄选,选取76个字词(包括48个单音节词和28个双音节词)组建成“阿都话语音参数库”的数据来源。
        4.2彝语阿都话的元音实验分析
        语音学(Phonetics)是通过实验手段对人类发出具有规律性和现实意义的声音信号进行实验分析研究的学科,彝语阿都话语音数据(声学)特征分析将充分运用到Praat的主要功能是对阿都话的语音、声音信号等数据进行提取和分析,如图7所示:

        利用Praat提取阿都话词首短元音基础的数据和语音参数,建立语音声学参数资源库,阿都话元音声学参数列表,包含如元音时长、元音强度及共振峰频率等参数数值。通过对元音两个共振峰的位置和刻度进行对比分析,清晰客观的总结分析出元音第一、第二共振峰(F1、F2)的数据分布情况。该现象粗略地说明,相对于较大,舌头位置较靠后,且圆唇度也较高。在现代语音分析学上经常以元音F1和F2的元音数值来描写任何一个元音的音色;经过语音系统性的分析和实验分析统计,发现在阿都话中元音总共13个,包括舌面音8个,其中前不圆唇3个,后不圆唇1个,圆唇4个,分别为[i ]、[e]、[a]、[?]、[?]、[u]、[o]、[ u];舌尖元音2个,分别是[?]、[?];根据实际标注中遇到的情况,总结出复合元音3个[ua]、[ue]、[ui];不存在舒唇元音和元音辅音化的情况。
此外,在阿都话元音系统中,[i ]、[?]、[u]、[o]、[?]、[ua]、[ue]、[ui]为松元音,[e]、[a]、[?]、[ u]、[?]为紧元音,下为彝语阿都话元音音系表:



        以下表格为阿都话元音为基准的例字词表:


        论文研究针对彝语阿都话当中的10个单元音所选的词汇的共振峰F1值和F2值及两者的差值,然后对音高(AV)的数值进行统计和归纳,详细情况如下表所示:


        通过运用办公软件Excel,完成数据的提取和统计,并利用得出的第一二共振峰数值计算出V值,并描绘出基于V值的元音格局图。
        根据石锋、时秀娟等实验语音学专家的相关研究显示,V值可以对应元音的舌位高低。这种划分为后续的语音格局图绘制提供数据方面的参考。经过对实验数据的整合分析处理后,以F2值为纵轴,以F1为横轴作图,得到彝语阿都话的单元音格局图。以下数据表和图示为彝语阿都话的V值表和彝语阿都话的元音格局:


        论文研究通过对四川凉山彝语阿都话的单元音([a],[o],[e],[i],[u],[u?],[?],[??],[?],[?])的组成词汇进行了声学统计分析,其过程主要参考元音共振峰(F1、F2)的频率、音强、音高、声学图等,从而进一步的探索到彝语阿都话元音发音生理机制。
        从元音发音时长为探入点进行分析,元音[i]的发音时长最长,而元音[u]时长则最短。元音[a]的开口度则最大,接着是[o]、[e]等,[i]的开口度最小。在元音第一共振峰的均值当中,元音[a]的发音处于最圆唇状态,舌位的共振腔越靠后,而元音[i]则最靠前。论文对目前彝语阿都话语音共振峰数据中已经出现的频率相对较多的[a]、[o]、[e]、[i]、[?]、[u]、[u]、[?]、[?]、[.]等10个元音,通过对囊括10个元音的大量的语音数据进行数据信息提取和实验分析,完成四川凉山彝语阿都话的声学分析,同时语音参数提取将为语音格局的建立和数据实验分析提供了丰富的数据信息,为彝语方言实验语音学研究提供了语料基础和数据分析探索。
        5结语
        习近平总书记曾指出:五十六个民族不断交流交往交融,形成多元一统的中华民族。中华文明历史悠久,是世界上唯一没有中断、发展至今的文明,党中央重视少数民族文化遗产的保护传承。[人民网.2019.习近平:要重视少数民族文化遗产的保护传承.[N].人民日报,2019-7-16.]为民族语言文化走向国际化、信息化提供了有力的支持。因此建设彝语方言语音资源数据库,从而真实记录彝语方言的面貌与现状,利用信息化手段尽量完整的保存和保护彝族方言资源,论文研究按语言调查规范标准化制定《四川凉山彝语阿都话语音调查文本》,运用语料库、MySQL、Web程序等技术完成彝语阿都话基础语音资源库的建设,同时针对彝语方言研究,从信息化领域结合实验语音分析,完成了彝语阿都话的元音分析,方便了四川凉山彝语阿都话研究工作者对语料的检索,提高语料使用效率和共享的有效途径,为其他彝语方言资源库建设的提供了一个可参考的解决方案。
参考文献:
1.王成平.2010.彝语元音松紧对立的声学参数分析[J].科技创新导报,(27):220-222.
2.潘正云.2001.彝语阿都话唇软颚复辅音声母比较研究[J].民族语文,(02):17-22.
3.沙马拉毅.2011.彝文信息处理技术三十年发展历程与展望[J].中文信息学报,25(06):170-174.
4.马丽,吉吉伍果,王晓涵.2015.保护彝族阿都方言,传承地域文化[J].商,(51):110.
5.李宇明.2010.论中国语言资源有声数据库的建设[J].中国语文,(04):356-363+384.
6.黄成龙.2016.当代中国少数民族语言资源调查[J].黔南民族师范学院学报,36(05):25-30.
7.王成平.2011.彝文信息处理技术的发展历程评述[J].人民论坛,(08):210-211.
8.石锋,冉启斌,王萍.2010.论语音格局[J].南开语言学刊,(01):1-14+185.
9.于荷云.2018.PHP 7.0+MySQL网站开发全程实例[D],北京:清华大学出版社,7-81.
10.人民网.2019.习近平:要重视少数民族文化遗产的保护传承.[N].人民日报,2019-7-16.
11.阿依努尔·努尔太.2012.维吾尔语元音格局研究[D].乌鲁木齐:新疆大学.
12.人物.沙马拉毅访谈:不能让一种语言消失后再想复活它.(2019-02-12)宁蒗人民政府视窗[EB/OL].
13.陈嘉猷.2001.三个少数民族语音声学参数数据库(光盘版)介绍[C]. 中国中文信息学会.新世纪的现代语音学——第五届全国现代语音学学术会议论文集.中国中文信息学会:中国中文信息学会,101-105.
14.王成平.彝语言语料资源数据库的设计与共享的实现[J].中文信息学报,2016(1):129-132.
15.Chengping Wang. Research on Design and Sharing of Yi Language Corpus Resources Database Based on Syntactic Rules [J]. Solid State Technology ,2020(5): 10618-10629.
16.王成平.彝语言文字信息技术的开发与应用发展研究.四川民族研究(第一辑)[M],2019:148-158.
作者简介:王成平(1979-),男,彝族,博士,副教授,主要研究方向:彝语言信息处理;孙某姑(1986-),男,彝族,硕士研究生,四川省雅安市名山区政府办、西南民族大学2017级民族语言文字信息处理专业硕士研究生;项目基金:教育部人文社会科学研究项目(17YJA740051)、四川省社科规划项目(SC20B130)、西南民族大学中央高校基本科研业务费专项资金项目(2016NGJPY07)的研究成果。

投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: