谁知道电脑是怎样认出手写汉字的呢?
谁知道电脑是怎样认出手写汉字的呢?
从工作原理上来说,对印刷汉字的识别与 识别手写汉字的工作原理是一样的。但是,由 于印刷汉字的字体一旦固定,字的形状就不会 发生什么变化,所以识别起来相对来说比较简 单。而手写汉字字型变化较大,基本上每个人 •写出来的字都不一样,所以识别起来困难很 大,是汉字识别中最困难的问题。
而且这也不像联机手写汉字识别,可以通过书写的笔画及 其顺序来判断。总之,脱机手写汉字识别被认 为是汉字识别领域最后一个“堡垒”。几十年来,各国学者做了许多研究,提出 了许多解决的思路与方法,但是,还是没有一 种行之有效的方法来解决识别自由书写的汉 字的问题。
手写汉字脱机识别的最基本问题就是建 立一个样本库,用于把扫描到的汉字拿来与库 中的字进行比较,找出最像的一个字。由于手 写汉字的随意性,要建立一个包含所有手写汉 字的样本库,是完全不可能的。但是,只要对 书写做一定的要求,建立一个标准的样本库还 是可能的。
例如中国科学院自动化研究所于 1988年建立了一个样本库,总共有4060个字 符(包括汉字、字母、常用符号等),每个字符 有1000个样本。同时,它要求书写的纸张有 8mm x 8mm的方格,书写者必须把字写在方 格内,不得潦草;书写笔的笔尖不得过粗,以免 笔画连在一起造成字型模糊s虽然有许多限 制,但是已经能够解决许多问题。
除了建立样本库之外,手写汉字脱机识别 的另一个重要的问题就是解决手写汉字的变 形问题。解决这一问题的第一种办法是在识 别的预处理过程中采取“矫形”处理,使汉字 形状变得工整而且标准,易于识别。虽然图形 矫正的方法比较多,但是却没有一种方法适用 于所有的字型矫正。
而解决变形问题的根本 方法,是精心选择识别特征,使它能代表各个 汉字的基本特点,又能适应字形变化。但是,要找到每个汉字独一无二的特点, 并不容易。各国学者在这方面做了许多工作, 提出了许多方案。如:结构识别法,即从结构 和形状上寻找特点,具体包括笔画分析法、笔 画序列识别法、多边形近似轮廓法等;统计识 别法,就是从各种统计数据,如密度特征、笔画 方向特征等,找出某一个字的统计特征。
事实 上,大多是采用一些综合特征,取长补短,以得 到较好的效果。虽然手写汉字脱机识别还存在着一些问 题,无法从根本上解决,但是人们相信,随着技 术的进步以及电脑智能的提高,这些问题肯定 很快就能得到解决。
答:脱机汉字识别,简单来说就是对一张纸上 已经写好的汉字,或是以前印刷的汉字进行识 别。乍一看,这种识别与联机手写汉字识别没 有什么区别,但是,这里的汉字可以是手...详情>>
答:详情>>
问:ABO溶血病治愈后会复发吗?儿子出生时诊断为ABO溶血病和G6PD酶部分缺乏,我...
答:1.ABO溶血病治愈后会复发吗? 不会 2.生活中有什么要注意的 别吃蚕豆详情>>
问:请教中医专家喝治疗胆囊炎中药期间能喝豆浆吗?请教中医专家和内行人士喝治疗胆囊炎中...
答:豆浆性偏寒,胆囊炎多属实属热,食用豆浆没有问题。 胆囊炎忌辛辣、油腻食物,忌饮酒,其他无特别禁忌。 饮食可选择食用瘦肉、鱼、奶和新鲜蔬菜,可食用各种水果。 情志...详情>>