星光大道崔成浩:使用OCR文字识别软件

来源:百度文库 编辑:偶看新闻 时间:2024/04/29 11:25:38
用相机把报纸上的字变成txt格式,让相机变成扫描仪。(使用OCR文字识别软件...

用相机把报纸上的字变成txt格式,让相机变成扫描仪。(使用OCR文字识别软件)



用8612把报纸上的字变成txt格式,使用OCR文字识别软件
先用 文本场景拍一张  
图片转文字
2009年01月13日 星期二 11:12
保证你是完全安装的Office2003的前提下,方法是:
第一步:转换文件格式。用ACDSee打开你的.jpg文件,单击界面上的“浏览器”按钮(或者双击当前图片都可以进入到浏览器界面),在打开的浏览器中,右键这个文件,在右键菜单中选择“工具/转换文件格式”;在转换文件格式对话框中,选择TIFF格式,两次下一步后,就开始转换,结果是将你当前的.jpg文件转换成了.tif文件。
第二步:将图片转换为文字。选择:开始/所有程序/Microsoft Office/Microsoft Office工具/Microsoft Office Document Imaging,打开这个工具后,菜单:文件/打开,找到你保存的那个.tif文件,打开它。然后选择菜单:工具/使用OCR识别文本;梢等一会儿,继续菜单:工具/将文本发送到Word。这样,这幅图片就到了Word中成了可以编辑的文字内容了。因为OCR识别并非百分之百成功,所以有些位置可能需要你进行手动修改。
(如果上述方法不行的话,就先把图片-->.BMP-->.TIF,这样就可以转了,已测试)

采用OCR V7 .5文字识别软件
步骤如下:
因为OCR V7 .5文字识别软件只能使用TIF、BMP、PXC三种格式的黑白图像文件。而数码相机输出的文件一般有两种格式,TIF格式和JPEG格式。由于获得的是彩色图片,所以要把导出的文件处理一下。在Photoshop软件中,选择“图像”命令菜单的“调整”选项,然后选“阈值”命令,该命令可以将一张彩色或者是灰度图片根据指定的阈值转变成一张具有高反差的黑白图片。们可以根据图片的效果适当调整图片的阈值,就可把数码相机导出的照片变成高反差的黑白照片,但这还不是二值(黑白)图像,需要把图片另存为BMP格式文件,关闭Photoshop软件。打开操作系统中附件里的“画图”软件,打开保存好的BMP文件,另存为单色位图文件。这样数码相机所拍摄的图片经过处理很容易就变成了OCR V7.5文字识别软件可使用的BMP格式黑白图像文件。
在OCR V7 .5文字识别软件中,在命令菜单中选择“打开”,在对话框的文件类型中选择“BMP格式”,打开文件,选好识别区域,就可识别文字,实际的识别效果非常不错。一页A4幅面的文稿只用几秒钟就可识别完成。
最后强调的是,文字识别的成功与否主要取决于数码相机拍摄图片的质量,一是要合理选择数码相机的像素,现在200万像素以上的相机很普及,价格也不贵。而只有640×480的30万像素老数码相机拍摄的图片文字识别率很低,一般不能用来翻拍。二是要合理使用光源,光线尽可能用自然的散射光,还要关闭数码相机的闪光灯。翻拍白纸黑字的文稿时,要使用手动拍摄模式并增加曝光补偿,拍出的照片才会光线均匀,经过Photoshop软件处理后字迹清晰,如果图片拍摄的好,可以不用在Photoshop中调整图片的阈值。只需要在Photoshop中转换一下图片的文件格式,然后就可以直接在“画图”软件中把BMP格式的图片文件调入并保存为单色位图文件。

http://dcbbs.zol.com.cn/frmView.php?frameon=yes&subcatid=139&bookid=566720&ref0=http://www.baidu.com/s?ie=gb2312&bs=%D3%C3%CA%FD%C2%EB%CF%E0%BB%FA%B4%FA%CC%E6%C9%A8%C3%E8%D2%C7%B5%C4%B7%BD%B7%A8&sr=&z=&cl=3&f=8&wd=%C8%E7%BA%CE%BD%AB%CA%FD%C2%EB%CF%E0%BB%FA%C5%C4%C9%E3%B5%C4%CE%C4%D7%D6%B1%E4%B3%C9word%CE%C4%B5%B5&ct=0为了您的安全,请只打开来源可靠的网址

打开网站    取消

来自: http://hi.baidu.com/%D0%E3%C6%C7/blog/item/18bef4345390791991ef3950.html