您当前位置: 必胜印刷网 > 印刷技术 > 印刷 > 正文

简析印刷中文字的识别方法研究

时间:2012-11-26 来源:中国印刷网

摘  要:
结构模式识别是早期汉字识别研究的主要方法。其主要出发点是汉字的组成结构。从汉字的构成上讲,汉字是由笔划(点横竖撇捺等)、偏旁部首构成的;还可以认 为汉字是由更小的结构基元构成的。由这些结构基元及其相互关系完全可以精确地对汉字加以描述,就像一篇文章由单字、词、短语和句子按语法规律所组成一样。 所以这种方法也叫句法模式识别。

关键词: 文字识别 

简析常见的统计模式识别方法

  结构模式识别是早期汉字识别研究的主要方法。其主要出发点是汉字的组成结构。从汉字的构成上讲,汉字是由笔划(点横竖撇捺等)、偏旁部首构成的;还可以认 为汉字是由更小的结构基元构成的。由这些结构基元及其相互关系完全可以精确地对汉字加以描述,就像一篇文章由单字、词、短语和句子按语法规律所组成一样。 所以这种方法也叫句法模式识别。识别时,利用上述结构信息及句法分析的方法进行识别,类似一个逻辑推理器。

  汉字的统计模式识别是将字符点阵看作一个整体,其所用的特征是从这个整体上经过大量的统计而得到的。统计特征的特点是抗干扰性强,匹配与分类的算法简单,易于实现。不足之处在于细分能力较弱,区分相似字的能力差一些。常见的统计模式识别方法有:

  (1)用变换特征的方法。对字符图象进行二进制变换(如Walsh,Hardama变换)或更复杂的变换(如Karhunen- Loeve,Fourier,Cosine,Slant变换等),变换后的特征的维数大大降低。但是这些变换不是旋转不变的,因此对于倾斜变形的字符的识 别会有较大的偏差。二进制变换的计算虽然简单,但变换后的特征没有明显的物理意义。K-L变换虽然从最小均方误差角度来说是最佳的,但是运算量太大,难以 实用。总之,变换特征的运算复杂度较高,且有一定弱点。

  (2)模板匹配。模板匹配并不需要特征提取过程。字符的图象直接作为特征,与字典中的模板相比,相似度最高的模板类即为识别结果。这种方法简单易行,可以并行处理;但是一个模板只能识别同样大小、同种字体的字符,对于倾斜、笔划变粗变细均无良好的适应能力。


关键词:文字识别 
热点排行
柯尼卡美能达黑白新品bizhub PRO 1200产品报告

革新化黑白数字印刷系统——拥有更全面的综…[详细]

上海紫光预推出数字喷墨印刷机PM520

上海紫光机械有限公司将在2011年11月举办的…[详细]

杭州东城图像公司推出热敏CTP和UV-CTP

近日,杭州东城图像技术有限公司重拳出击,…[详细]

大族冠华新推GH794四色商务印刷机亮相全印展

第四届中国(上海)全印展于11月14日隆重召开…[详细]

美企业推出新概念UV-LED喷墨丝网印刷机

据来自美国wxow网站的消息,丝网印刷机厂商…[详细]

柯尼卡美能达bizhub PRESS C7000/C6000产品报

2011年8月5日,柯尼卡美能达在北京展出了其…[详细]

更多知识手册