原因是PDF文件是扫描的,扫描的时候页面不可能百分之百的端正,而且如果是图片的话,要转成可编辑的字符。

解决方法:要用到ORC技术,现在最好的ORC软件也不可能做到对扫描的文字百分之百正确的分辨。所以对于某些PDF文件来说,要求还是别太高了。