在线服务>>产品特性&技术文档
 
ABBYY FineReader 9.0 Sprint使用方法介绍
 


    绝大多数中晶科技的扫描仪产品,会随机附赠一版ABBYY公司出品的FineReader文字字符识别软件,通过它可以帮我们实现扫描并做识别的功能,免去重新打字和排版的困扰。下面介绍一下怎样用。

 

1、启动文字识别软件ABBYY FineReader 9.0 Sprint

 

从“开始”“所有程序”“ABBYY FineReader 9.0 Sprint”目录中运行“ABBYY FineReader 9.0 Sprint”,看到运行的初始界面:


 

识别语言选择“简体中文”,如下图所示


想将原稿识别成为Word档的请选择“扫描到Microsoft Word”;想将原稿识别成Excel档的请选择“扫描到Microsoft Excel”;另外还提供将原稿扫描成PDF格式和扫描图片并通过系统自带的OUTLO0K转发(在此不做介绍)。

 


我们以扫描到Microsoft Word为例,实际操作演练一遍。

 

问题2解决方法:“每个文本框(绿框)与所在框内的文案过于靠近或重叠。”
只要加大文本框(绿色边框)与框内文案之间间距即可,保证边框不磕到文字。调整前调整后

问题3解决方法:“图片框(红框)与文本框(绿框)重叠。”
与问题2处理方式同样道理。
调整前调整后

 

 

2、扫描前设置


选择这项进入扫描界面(如下图所示)。操作过程是先“预览”后框选识别范围,再点击“扫描”,完成后点击“关闭”,进入版面分析页面。

 


技巧在于:1.先点击“预览”,然后框定你要识别的范围(多余影像不要框选在内);2.右侧的参数设定,默认为灰阶、300dpi方式的系统设定(比较适合一般白底黑字的A4文件),如果需要将原稿中存在的彩色图片部分一并识别,请将色彩模式改为“彩色”,否则原本彩色图片将被扫描成灰阶影像;3.对于较暗或色彩背景复杂的原稿,则适当手动调亮一点即可。

 

3、自动版面分析及自动识别导出

当在上图中点击“关闭”按键会自动进行版面分析,如下图所示。


分析完毕后会紧接着做OCR的识别动作,并自动导入到对应的应用程序Word中展示(当前系统已安装OFFICE软件),如下图所示。
 

 

 

感觉识别效果不怎么样嘛!
没关系,我们可以回过头分析下原因!

 


    根据上图,问题点分析:1.版面夹杂了图片与文字,且有的文案没有被框进(微健康)。2.每个文本框(绿框)与所在框内的文案过于靠近或重叠。3.图片框(红框)与文本框(绿框)重叠。以上3点均会影像到识别率。

 

问题1解决方法:“版面夹杂了图片与文字,且有的文案没有被框进。”
这一句既有图案又有中\英文文案的负责部分,我可以用图片方式来代替操作步骤如下:

 

a.分别选中这两个绿框,按“删除区域”。

 

b.鼠标点住右下角不放,进行拖拽覆盖这部分区域,如下图所示。
 

《---该选项可以在上述大图中右侧找到。

 

问题2解决方法:“每个文本框(绿框)与所在框内的文案过于靠近或重叠。”
只要加大文本框(绿色边框)与框内文案之间间距即可,保证边框不磕到文字。调整前调整后

 

问题3解决方法:“图片框(红框)与文本框(绿框)重叠。”
与问题2处理方式同样道理。

 

调整前

调整后

 

        经过人工干预调整,将原稿扫描影像中较为复杂用“绘制图片区域”框好;将各框之间保持适当距离,如下图所示。

 


 

保存识别结果

 

        点击“转换”按钮后,根据调整后的版面分析系统进入自动识别。识别完成后自动弹出识别结果,您会惊奇的发现识别率大大提高且维持了原有排版,稍加修改错别字之后即可保存此文档了。
 

如需提高识别率,就必须人工干预!