设计排版
æµ…è°ˆå°åˆ·ä¸­æ–‡å­—的识别研究方法
2012-09-07 14:45  ???:2191

  结构模å¼è¯†åˆ«æ˜¯æ—©æœŸæ±‰å­—识别研究的主è¦æ–¹æ³•ã€‚其主è¦å‡ºå‘点是汉字的组æˆç»“构。从汉字的构æˆä¸Šè®²ï¼Œæ±‰å­—是由笔划(点横竖撇æºç­‰)ã€åæ—部首构æˆçš„;还å¯ä»¥è®¤ä¸ºæ±‰å­—是由更å°çš„结构基元构æˆçš„。由这些结构基元åŠå…¶ç›¸äº’关系完全å¯ä»¥ç²¾ç¡®åœ°å¯¹æ±‰å­—加以æ述,就åƒä¸€ç¯‡æ–‡ç« ç”±å•å­—ã€è¯ã€çŸ­è¯­å’Œå¥å­æŒ‰è¯­æ³•è§„律所组æˆä¸€æ ·ã€‚所以这ç§æ–¹æ³•ä¹Ÿå«å¥æ³•æ¨¡å¼è¯†åˆ«ã€‚识别时,利用上述结构信æ¯åŠå¥æ³•åˆ†æžçš„方法进行识别,类似一个逻辑推ç†å™¨ã€‚

  汉字的统计模å¼è¯†åˆ«æ˜¯å°†å­—符点阵看作一个整体,其所用的特å¾æ˜¯ä»Žè¿™ä¸ªæ•´ä½“上ç»è¿‡å¤§é‡çš„统计而得到的。统计特å¾çš„特点是抗干扰性强,匹é…与分类的算法简å•ï¼Œæ˜“于实现。ä¸è¶³ä¹‹å¤„在于细分能力较弱,区分相似字的能力差一些。常è§çš„统计模å¼è¯†åˆ«æ–¹æ³•æœ‰ï¼š

  (1)利用å˜æ¢ç‰¹å¾çš„方法。对字符图象进行二进制å˜æ¢(如Walsh, Hardamaå˜æ¢)或更å¤æ‚çš„å˜æ¢(如Karhunen-Loeve, Fourier,Cosine,Slantå˜æ¢ç­‰),å˜æ¢åŽçš„特å¾çš„维数大大é™ä½Žã€‚但是这些å˜æ¢ä¸æ˜¯æ—‹è½¬ä¸å˜çš„,因此对于倾斜å˜å½¢çš„字符的识别会有较大的å差。二进制å˜æ¢çš„计算虽然简å•ï¼Œä½†å˜æ¢åŽçš„特å¾æ²¡æœ‰æ˜Žæ˜¾çš„物ç†æ„义。K-Lå˜æ¢è™½ç„¶ä»Žæœ€å°å‡æ–¹è¯¯å·®è§’度æ¥è¯´æ˜¯æœ€ä½³çš„,但是è¿ç®—é‡å¤ªå¤§ï¼Œéš¾ä»¥å®žç”¨ã€‚总之,å˜æ¢ç‰¹å¾çš„è¿ç®—å¤æ‚度较高,且有一定弱点。

  (2) 模æ¿åŒ¹é…。模æ¿åŒ¹é…并ä¸éœ€è¦ç‰¹å¾æå–过程。字符的图象直接作为特å¾ï¼Œä¸Žå­—典中的模æ¿ç›¸æ¯”,相似度最高的模æ¿ç±»å³ä¸ºè¯†åˆ«ç»“果。这ç§æ–¹æ³•ç®€å•æ˜“行,å¯ä»¥å¹¶è¡Œå¤„ç†ï¼›ä½†æ˜¯ä¸€ä¸ªæ¨¡æ¿åªèƒ½è¯†åˆ«åŒæ ·å¤§å°ã€åŒç§å­—体的字符,对于倾斜ã€ç¬”划å˜ç²—å˜ç»†å‡æ— è‰¯å¥½çš„适应能力。