爱问知识人 爱问教育 医院库

哪一种扫描仪能进行文字识别并直接进行编辑

首页

哪一种扫描仪能进行文字识别并直接进行编辑

哪一种扫描仪对文字识别率高,并可以直接转换为WORD,进行编辑?

提交回答

全部答案

    2005-06-23 19:30:47
  • 关键是识别软件。

    m***

    2005-06-23 19:30:47

  • 2005-06-20 00:29:33
  •   实在地说,现在所有的市场上主流的扫描仪都可以,而且识别率都差不多。识别率的关键在于识别软件和你的操作水平。现在的主流识别软件对中文的识别都不错,但是对标点和公式的识别能力就不怎么样了。
    要设置扫描的色彩深度、分辨率、亮度和对比度、去网纹等参数。
      这里要注意的是扫描分辨率,一般来说扫描分辨率要合适,通常设置在300dpi;分辨率设置过低过高都的话会严重影响识别率。某些识别软件要求必须用黑白二色TIFF格式来扫描,不支持用真彩色来扫描,否则识别率就非常低。用其他格式扫描的也可用图形处理软件转换成黑白二色TIFF格式后识别。
      关键是要多用,慢慢会掌握规律的。 TH-OCR MF7。5网上培训 下面是: §1、OCR快速入门 启动OCR识别软件,点按扫描图标,出现扫描界面。 将要识别的原稿放入扫描仪,"预览"并设置扫描参数及扫描区域,最后点按"扫描"进行终扫。
       扫描完成后退出扫描界面,文字图像将出现在识别界面中,首先进行版面分析,即将要识别的部分按顺序及类别分别划分,再点按识别图标进行识别。 识别完成后直接进入编辑界面,可进行文字的修正。若想进行重新识别或扫描则需退回到识别界面并点按钢笔图标继续。
       编辑完成后,可直接存盘成为纯文本的格式或导出成RTF格式的文件。 §2、OCR详解 一、简介 OCR是一种光学字符识别软件,"OCR7。5"是目前最新版本,它保留原有版本简体多体、繁体多体(宋体、仿宋体、黑体、楷体、魏碑)、中英文混排、横竖版面混排识别及版面分析等功能外,新增加了批量识别、手写识别、表格自动识别及导出表格等功能。
       OCR程序组的介绍,OCR安装过程很简单,完成后在"开始/程序"中将新添一个"紫光OCR MF7。5"程序组,包含内容有: Select system Inner-code选择系统内码 TH-OCR MF7。5执行程序 TH-OCR Readme Uninstall TH-OCR卸载程序 二、操作流程: 启动TH-OCR MF7。
      5应用程序 系统设置(设置系统参数、设置识别参数、设置其它参数、设置后编改参数)一般按默认设置值即可 打开已扫描好的黑白二值图像文件或扫描二值图像 像版面处理(版面倾斜校正、版面分析处理、设置区域属性) 文字识别(图象表格文字的分别定义、最终识别) 编辑修改识别结果 存盘、导出及退出TH-OCR。
       注:整个流程中会出现三个不同界面(扫描驱动界面、识别界面、文本编辑界面) 三、菜单 文件菜单包括文件管理、扫描、打印及退出四部分的命令。主要命令如下: 另存为:可将图像(TIFF、BMP、PCX)或文本文件(TXT不含格式的纯文本文件)指明路径、文件名及文件格式存储起来。
       导出:可将文件导出成为RTF(包含文字及表格的一定属性的且可被word直接打开的一种文件格式)或TXT(导出时可设定是否包含硬回车)。 关闭所有文件:当扫描多页时,可合并多页已识别好的文件或临时文件;可选择是否删除图像文件、跟踪文件及原单页的文本文件。
       扫描设置:包括使用TWAIN界面扫描和直接终扫两类选项;通常默认是使用TWAIN界面扫描,而直接终扫的优势在于速度快,可提高工作效率,建议在做大量扫描识别工作且原稿一致的情况时使用。 扫描:详见"扫描仪使用手册" 打印:建议用户最好在word或wps等文字编排软件中进行打印。
       分辨率设定与字号大小对照表 文字大小 准确分辨率(DPI) 推荐分辨率(DPI) 1号(26磅) 150 200 2号(22磅) 180 3号(16磅) 200 4号(14磅) 240 300 小4号(12磅) 280 5号(10。
      5磅) 300 小5号(9磅) 350 400 6号(7。5磅) 400 7号(5。5磅) 500 600 8号(5磅) 600 编辑:(编辑与识别是两个不同操作界面,按F4或"钢笔"图标可切换这两个操作界面)此菜单主要是对剪贴板的管理,执行剪切、拷贝、粘贴、清除等操作,还有对识别后文字修改方式的选项。
       图像:包括图像处理、区域管理及识别类型等设定。 命令:包括识别、版面分析、系统设置等(其中用户自学习、修改用户库的功能只在零售版OCR7。5中支持) 设置:系统、扫描、识别、后编改、其它 显示:控制显示比例、显示不同页的文件及工具条、状态行的显示。
       帮助 四、表格的识别与导出 表格被扫描出来后便会进入识别界面,识别步骤如下: 版面分析: 将表头或文本部分用鼠标画一个方框框出,并定义为"正文"属性,框线为兰色。 将完整的表格图像框出,定义成"表格"属性,框线为粉红色。
       依原稿类型定义文字属性为简体多体、繁体多体或其它 识别 导出(由于包含表格,因此一定要导出为RTF格式,否则格线是断开的)。 五、技巧 原稿一定要摆放端正,若稍有倾斜可使用OCR中的倾斜校正,若倾斜角度较大时,则需进行手动的纠斜(按住鼠标的右键在图像中拉一条平行于倾斜文字行的直线。
      然后,放开鼠标的右键则校正完成。)但如果倾斜角度超过15o,则会由于倾斜校正产生较大的失真和误差,从而影响识别结果,建议重新扫描图像。 当版面分析出现多个文本识别区域,需要改变区域之间识别的顺序时,具体操作为:在当前的区域内部,按住键盘上Ctrl键的同时按住鼠标左键并拖动画线到新所在的区域中即可。
       注意: 日文识别模块为选购件; 进行日文识别必须具备日文环境; 手写识别对文稿有一定的要求,文字需写在无格白纸上,自间距合适,而且笔迹要规范,不要潦草。 六、退出(退出时,建议用户删除不需要的图像及跟踪文件,可节省硬盘资源) 七、常见问题 在扫描文稿图像时,提示"只能扫描二值图像"或"该程序执行了非法操作"。
       OCR软件一般只能识别黑白图像,因此扫描时只能使用"黑白二值"模式。若设置了多个扫描区域,而其中有区域设置为彩色或灰度模式,便会出现"该程序执行了非法操作"的提示。 扫描时提示"装入TWAIN。dll错误"。 请正确安装紫光扫描仪的驱动程序,连接好扫描仪,并将紫光扫描仪打开。
       识别完成后屏幕为空白,只有光标闪动。 如果原稿中有图形,OCR会认为此文件不符合要求而不作识别。此时应先进行版面分析,将所要识别的文字区域按顺序框出识别区域后再进行识别。 识别出的文字出现乱码。 是否文字的方向不对,请正确调整文字方向。
       是否定义的文字属性(简体多体、繁体多体、纯英文、手写体等)与原稿不符,请设定字旁有辅助线,字体为斜体或艺术字等,此类原稿不能被正确识别。 是否原稿中的文的分辨率是否不合适,请在扫描 扫描时设置相应的文字属性。时参照分辨率设定与字号大小对照表中的推荐值选择适合的分辨率。
       扫描文稿时设定了镜像处理功能,扫描结果图像与原稿左右相反。 原稿不清晰(如传真件、油印试卷、报纸等),若是报纸,可以适当地调节图像的对比度或亮度以得到较好的扫描效果,提高识别率。 文章开始部分识别率较高,但后半部识别率低。 原稿在扫描时摆放的不正,若倾斜角度不大可进行倾斜校正,否则需重新扫描。
       表格识别时,只识别出表头而无表格。 没有单独定义出表格属性。请按表格的识别与导出部分的说明进行版面分析。 识别繁体字得到简体字而非繁体字。 请从Windows操作系统的"开始"菜单指向"程序"中的"紫光OCR"程序组,选中"Select System Inner-code"选项,在"CODESET"对话框中选定"GBK-code(All China)"选项。
       不能退出系统 退出时,在"关闭所有文件"对话框的合并文件栏选中"合并所有结果文件"选项或在暂时文件栏选中"以新名存储暂时文件"选项,但未命名。请指定文件名或取消选项。 取得帮助 从"帮助"菜单选择"目录和索引"命令,显示帮助主题,可以选择帮助主题或索引帮助内容;选择"快速指南"命令,显示OCR识别的基本操作流程。
       。

    冥***

    2005-06-20 00:29:33

类似问题

换一换

相关推荐

正在加载...
最新问答 推荐信息 热门专题 热点推荐
  • 1-20
  • 21-40
  • 41-60
  • 61-80
  • 81-100
  • 101-120
  • 121-140
  • 141-160
  • 161-180
  • 181-200
  • 1-20
  • 21-40
  • 41-60
  • 61-80
  • 81-100
  • 101-120
  • 121-140
  • 141-160
  • 161-180
  • 181-200
  • 1-20
  • 21-40
  • 41-60
  • 61-80
  • 81-100
  • 101-120
  • 121-140
  • 141-160
  • 161-180
  • 181-200
  • 1-20
  • 21-40
  • 41-60
  • 61-80
  • 81-100
  • 101-120
  • 121-140
  • 141-160
  • 161-180
  • 181-200

热点检索

  • 1-20
  • 21-40
  • 41-60
  • 61-80
  • 81-100
  • 101-120
  • 121-140
  • 141-160
  • 161-180
  • 181-200
返回
顶部
帮助 意见
反馈

确定举报此问题

举报原因(必选):