基于二叉树原理的支持向量机模型的字符识别

发表时间:2020/10/20   来源:《科学与技术》2020年17期   作者:王文文,杨帅,齐永营
[导读] 字符识别是电子设备将图片翻译成计算机文字的一种方法。
        王文文,杨帅,齐永营
        华北理工大学 河北唐山 063210
        摘 要:字符识别是电子设备将图片翻译成计算机文字的一种方法。准确的识别字符对文字的处理具有关键性的意义。运用特征特性及MLP的多层感应器算法解决有效特征的选取。首先了解特征选取类型为网格特征,穿越特征,外围特征。其次对于数据进行分类,并通过神经网络多层感知器得到数据变量的重要性,最终选取字符黑色像素点分布,的平均方差和的平均方差,与的边缘相关性等作为字符特征。
        关键词:字符识别;二叉树原理;支持向量机;R语言

一、模型假设
        在使用二叉树模型时,规定树层在5层高,排除步数小时精度不高和步数过大时计算难度复杂的问题给模型求解所带来的困扰。
                在运用支持向量机时,假设题目中所给的样本集中并没有数据缺失,筛选过后的每一个个案中的数据均为完整的、可靠的;对于本文的非线性问题采取对



二、模型的建立及求解
2.1数据的预处理
对数据进行分析,理解数据意义。表1是描述图像分割状况,即每一个样本所在的矩形区域的位置以及成像状况。


2.2算法陈述   
                                                                                           (1)


                                                                                        图2 符号实际意义
        第三步,以分割和特征子集训练SVM子分类器。每一个SVM子分类器包含一个线性核函数。根据生成的二叉树,利用二值SVM训练算法构造二叉树各内节点的最优超平面。
参考文献
[1]李昀. OCR系统前处理的研究[D]. 南开大学, 2000.
[2]庞东虎, 金伟杰. 英文字符特征提取系统[J]. 计算机仿真, 2007, 24(12):208-210.
作者简介:王文文(1998年9月-) 女; 汉; 河北邢台人;大学本科。研究方向:电子信息工程
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: