惊鸿艳影 惊为天人:图片格式的PDF如何把其中的问题分离出来?

来源:百度文库 编辑:高考问答 时间:2024/05/11 19:42:25
我手头上有个pdf格式的文件,是由扫描仪扫描进入的文字文档,我用过Adobe Acrobat 7.0 Professional 的“另存为”,可是转化后的word仍是图片格式的文字,仍不能进行编辑。
所以我现在用的是键盘上的“Print Screen”截图然后用OCR进行文字识别,由于原本的pdf文件的扫描很不清晰,所以一页要截图两次,否则识别率极低。我这个文档有五百多页,这样进行了3天也才搞了60多页。
所以请教高手,如何才能批量处理 ?
谢谢!

http://www.yesky.com/109/1816609_1.shtml
来这里看看吧,有可能帮到你!!

装一个识别软件:汉王识别,别的什么就解决了。