羡慕与嫉妒的区别名言:pdg 转化为 word

来源:百度文库 编辑:偶看新闻 时间:2024/04/25 04:32:56

 

 

 只有2003版的OFFICE 才自带有虚拟打印机,所以,首先你要在机器上装了Office2003。装好后,在“控制面板”-->“打印机和传真”里,我们能看到一台名为“Microsoft Office Document Imaging”的打印机。

 

 

  我们开始工作了!

  第一步 当然是先把超星的书下载回来,我下载了一本《中国艺术经典全书--魔术》。

  打开后,点击左面栏“章节目录”,在下拉框中选择“页列表模式”,这样我们能知道要打印多少页。如图。

 

 

  第二步:打印设置

  选择“图书”-->“打印”,弹出“打印设置”窗口,设置打印页数和方式。我们只打印目录页和正文页,共137页。其它使用默认设置。如图:

 

 

  在弹出的“打印”窗口中,选择微软的虚拟打印机,勾选“打印到文件”复选框。输出路径可以在“首选项”按钮的“高级”选项卡中设定。打印的生成的文件的扩展名是.mdi。

 

 

  注意:超星会检测打印名称中是不是含有“image”,“office"等字样,若有,就拒绝打印。所以我们要把打印机的名字改一下。上图中的“超星打印机”就是Microsoft Office Document Imaging 打印机。


  第三步:执行OCR识别功能

  打印完成后,文件将自动打开。

 

 


  大致浏览一下,把空白页和图片太多的页删掉。然后在工具栏点击word样的图标,弹出“将文本发送到WORD”窗口,直接确定,MS Office Document Imaging便开始执行文字识别功能,并将识别的内容写入与打印文件相同目录下的同名word文档。

 

 

  文字识别执行完成后文档自动打开。这里打开的是一个网页文件,我们将其另存为.doc。

  生成的文件中有乱码是必然的。在排版复杂或图片多的文件中尤其如此。OCR会努力把图片当成文字来识别(呵呵,挺用功的~)通常我们需要要把文中多余的空格和回车删掉。最后,把乱码修改一下,OK,大功告成!

如果灵活应用,应该会给学习,生活和工作带来很大便利.