燕文浩
中国移动通信集团陕西有限公司 陕西 西安 710077
摘要:随着网络和客户规模的不断扩大,如何准确定位并高效处理客户投诉成为不断提升通信运营商服务质量和行业竞争力的关键。为解决当前通信运营商投诉分析定位效能低下,投诉处理与网络问题解决流程割裂的问题,引入基于地址模糊识别技术和大数据应用的思想,通过开发承载系统,实现投诉与网络问题的智能化显性化强关联,并使之驱动网络运维生产流程。通过数10万条地址的积累和清洗,以及超过5万条投诉工单的运算验证,小地址识别度可达到89%,引发投诉的网络问题初期定位成功率可达到83%左右,同时可实现对规划、建设等工作流程的一键串接。可实现通信运营商减员增效的同时,还能为投资决策提供价值评估的客观依据。
关键词:地址模糊识别;大数据;投诉处理;智能化
引言
前期对移动网络质量一线投诉处理工作进行了大量的调研和流程穿越,从结果看,现有投诉处理过程中往往需要高频次调用客户、地址、网络规划、建设、告警、信令、性能等多种数据,但这些数据分布在不同的业务系统中,关联分析极为不便;且地址定位需要在地图上人工量取,分析处理方式较为粗放且效率低下。同时,当前投诉流转过程未与网络生产流程打通,造成投诉处理无法追踪。现有投诉生产体系各方面较为陈旧滞后,作为关键售后环节,无法有效支撑业务的快速发展。针对上述问题,作者从精确化和智能化思路出发,以“精确定位、精准识别、线上留痕”为目的,依托地址识别、大数据采集应用、多流程嵌入等技术,经过海量数据反复清洗验证定型,提出了这一面向投诉处理全流程的系统性解决方案。
1 研究背景与价值
1.1业务发展同步带来的客户投诉增长
自2017年以来,截至目前,全省累计有13.75万名通话客户产生过狭义投诉,其中曾投诉不少于2次的客户2.24万名,占比16.28%,平均每用户投诉1.25次。客户投诉压力较大。
1.2投诉分析支撑手段薄弱
投诉分析处理手段薄弱,每一单投诉往往都会涉及网络规划、建设、维护、优化等各个业务线条,投诉人员基本以手工方式调取各种复杂的网络类数据,并进行人工综合分析为主,缺乏智能化归一化手段,制约投诉分析处理效率。
1.3投诉处理过程未线上留痕
目前全省投诉处理仅以电子工单形式简单流转,而实际网络问题处理在线下完成,网络问题解决情况无法留痕追踪,造成投诉处理质量无法管控。
1.4研究价值与意义
建立将客户投诉与网络问题显性化强关联的归一化综合支撑系统,不仅有效提升投诉处理质量和管理水平,也是对现有网络服务体系的重大变革,实现运营商的减员增效提质,还可进一步形成价值评估标准,为运营商投资决策提供客观依据。
2 系统架构与技术要点
2.1系统逻辑架构
整体为投诉工单电子流引入、地址识别定位、智能预处理、自动分派处理、质检与监控、其他应用支撑、结束闭环等七大逻辑部分组成。
.png)
2.2 软件基于HADOOP架构
系统采用面向大数据处理的分布式HADOOP软件框架搭建,由HDFS提供大数据的存储功能,由MapReduce提供大数据的运算功能。
.png)
2.3 地址模糊识别及基于最优路径的自纠正算法
客户投诉内容中最核心最基础的是地址信息,地址信息主要以客户电话告知,话务员人工录入的方式产生,受客户描述不清、方言识别、话务员主观性等潜在因素影响,地址识别一直以来具有不确定性、不规范性、识别性参差不齐等困难。
为解决这一难题,作者按照三步法来逐步实施地址精确识别。
2.3.1地址库初创
将日常网络测试、投诉处理积累、基站工参信息、室分和优化设备物业点库信息,结合MapInfo等数据整合,建立基础地址库。
2.3.2地址模糊匹配
基础地址库创建完后,库中仍会存在地点信息混杂(同时包含区、镇和道路等,并且无层次关系)、小地点信息缺失(只包含少量信息)、书写错误(错别字)等大地址和杂质信息,此时仍需进一步地址清洗提纯:
1)匹配规则按照完全匹配->拼音匹配->模糊匹配->拼音模糊匹配->自定义匹配的顺序对地址进行识别,解决错别字引起的无法识别问题;
2)设置地点之间的归属关系和级别:按照地市->乡镇->街道->具体地点来设置地点之间的归属关系;
3)根据地点的可定位性,来设置的级别,越容易定位的地点,级别编号越低(1-10级);
4)按照可识别性,从识别性高的地址级别开始匹配同名地点的区分:如昆明理工大学,按照所属区域自动设置为昆明理工大学(五华区)、昆明理工大学(盘龙区);
5)设置地点的别名:按照用户的称呼习惯设置别名,如昆明理工大学可设置为昆理工。
地址识别流程图如下:
.png)
2.3.3基于最优路径的地址自校正清洗提纯
地址模糊识别完成后,为进一步提升精度,仍需进行二次自校验完成清洗,这里采用二维模型相似度的最优路径算法进行提纯。方法如下:
1)建二维模型
以西安西北大学为例,按优先级关系遍历地址库中的地点信息,若地点中包括有相同字(包括同音字)便进行标记。建立二维数据模板,如下图所示,横坐标为投诉地点名,纵坐标为地址库中地址。
.png)
2)最优路径算法
通过模型图可以看到,如果地点是完全匹配的情况下,那么模型的标记便是对角的斜线,该线路便是最优路径,匹配地址的过程便是寻找最优路径的过程。对模型图进行分解,以标记所属的坐标值,计算与前一坐标的差值,并取绝对值求和,得出的结果便是路径值F(X),该值越小越优越,计算公式如下:
其中n(m),表示数据模型的行数,表示当前标记中的行坐标,表示当前标记中的列坐标,表示前一个标记中的行坐标,表示前一个标记中的列坐标,表示路径值,另外为默认值0。
3)命中率校验
命中率算法用于最终识别结果校验,指匹配地址与实际地址的同字或同音的字数,与匹配地址的数目之比。上图数据模型中实际地址为西安西北大学,而匹配地址中西北工业大学命中率为60%,西安西北大学为100%,西安北三环大明宫为50%。
2.4 大数据采集与流程对接
整体上分为采集层、存储与运算层、应用层三层架构,该部分是整个智能预处理及质检监控、统计分析功能的核心,也是整个系统功能的基础。架构如下:
.png)
2.4.1大数据采集
目前系统设计采集的数据类型如下18种,采用可扩展设计,未来可根据需要,不断补充新的数据类型。
表1 评分项目说明
对接数据 使用说明
4G/VOLTE信令
CSFB信令
GSM信令
室分物业点库
站点搬迁数据
规划库数据
批复工期数据
告警数据
性能数据
集中开站数据
宏基站工参
现网参数
天姿数据
设计审核数据
MR数据
EOMS工单
集中优化工单
经分数据 用于4G手机上网及VOLTE语音事件分析及辅助定位
用于CSFB语音事件分析及辅助定位
用于GSM语音事件分析及辅助定位
用于支撑地址库及室内投诉定位
支撑投诉原因判断,是否由于站点搬迁未回填造成投诉
支撑投诉原因判断,是否已纳入规划以及相应状态监控
支撑投诉原因判断,是否属于建设问题
支撑投诉原因判断,是否属于维护问题,以及相应告警状态监控
支撑投诉原因判断,是否属于性能问题,以及相应性能状态监控
支撑投诉原因辅助判断,是否属于建设问题,以及相应工程建设进度状态监控
基础网元数据获取,用于地址定位后的网元关联
基础网元数据,辅助性能问题定位
基础网元数据,辅助建设问题状态判断
辅助建设问题状态判断
辅助性能和覆盖问题判断
投诉基础信息及地址数据
向集中优化工单打投诉标签,辅助优化工单评级
用于客户属性及业务关联网元的辅助定位
… …
.png)
2.4.2网络问题判断规则及一键触发生产流程
该功能基于大数据存储和运算而实现,属于应用层核心功能,也是解决当前投诉问题的关键模块。具体为系统将采集来的大数据,根据规划、建设、维护、优化四大类网络问题的实际触发规则,智能输出网络问题的判断结果。同时与规划、建设、维护、优化等相关生产系统对接,实现投诉一点驱动。
.png)
图中A-H代表8个算法控制点:
A、投诉区域关键信息定位(数据来源:投诉客户反馈位置及时间)
B、室分数据库匹配 (数据来源:室分在线验收平台)
C、站点搬迁数据库匹配(数据来源:站点搬迁数据库)
D、现网站点数据库匹配(数据来源:陕西移动天线姿态仪管理)
E、规划批复、开通数据库匹配(数据来源:规划质量管控平台)
F、站点滚动规划需求数据库匹配(数据来源:规划质量管控平台)
G、实时告警数据匹配(数据来源:集中故障管理系统)
H、关键性能指标匹配(数据来源:网优平台) 。
2.4.3投诉处理过程全流程线上管控
依托该系统,在实现地址识别、问题智能定位的同时,可实现投诉处理各角色线上显性化配置及处理动作全流程监控,由此实现投诉集中化管控。
.png)
3 应用效果
从系统压力测试验证情况来看,系统一次定位准确率(包含地址匹配过程)在83%左右,基本达到预期,可以满足基本生产需要。
效率提升方面,原先处理一单投诉,平均需要耗费10到20分钟来调齐所需基础数据并完成定位分析,现在由系统自动完成,约1分钟左右即可完成全过程,效率提升10倍以上。
人员方面,原先平均每地市配置7人负责投诉处理工作,系统投产应用后,可节约预处理人员约3人,可减少43%的人员配置。
经济效益方面,按全省10地市,单项8万元计算,仅人工成本一项每年约节省240万元。可缩短投诉处理周期9到19分钟,每分钟通话收入0.1元,流量按业务模型综合评价,每分钟约1.2MB,每MB流量收入约0.01元,各自业务概率按50%计算,全省客户约2400万,平均问题解决率35%,保守测算年均挽回业务损失约2.4亿元。
24000000×14×0.01×1.2×0.5×0.35×365+24000000×14×0.1×0.5×0.35×365=2.4亿元
4 结束语
本文成果是对现有传统投诉处理工作方式的彻底变革,同时基于大数据应用对客户投诉处理方式具有普遍适用性,也符合未来客户服务工作的转型趋势。文中所提出的解决方案现阶段主要是针对具有完整投诉内容的狭义网络投诉,具有较好的效果和显著经济效益。对于客户广义投诉,由于其信息相对较少,且主要以录音文件方式存储,针对比狭义投诉更加海量的广义投诉,需要引入成熟的语音识别技术,将录音转化为文本后,也可以纳入本方案解决。
参考文献
[1] Tom White. 大数据的存储与分析[M]. 清华大学出版社, 2017.
[2]刁莹. 用数学建模方法评价存储系统性能[D]. 哈尔滨工程大学, 2013.
[3] Bob Smith. Intelligence in Major Data Processing [M]. UK: Pergamon Press Ltd, 2015.
[4] 傅由甲.网络工程专业《移动应用程序开发》课程教学研究与实践[J].教育教学论坛,2016,(3):85-86.
[5]胡捷.移动网络优化中的大数据技术分析[J].电信技术,2018,(12):174-175.
[6]田太保.竞争性业务开放背景下电信行业服务创新研究[J].华北水利水电大学,2018,(5):208-209.