很多pdf 檔案中的文字都是不能複製的,要麼pdf 檔案經過了加密,要麼pdf 中全是圖片格式的,都不能複製,下面小編就介紹一種通用的方法,提取所有pdf 檔案中的文字。
具體思路是,我們通過超強的圖片識別軟體來識別pdf中不能複製的文字。
工具/原料
超強OCR識別軟體多語言免安裝免費版
方法/步驟
下載 超強OCR識別軟體多語言免安裝免費版。下載地址:點選圖中的下載。
下載後解壓檔案,得到超強OCR識別軟體多語言免安裝免費版資料夾,進入資料夾,找到Abbyy綠化.exe,
點選Abbyy綠化.exe,出現如圖,我們點選安裝,
安裝後找到 FineReader.exe,點擊出現如下介面,開啟pdf檔案,如圖中的打卡圖片/pdf檔案。
打卡後彈出對話方塊,選擇我們不能複製的pdf 檔案。
等識別步驟完成後,點選圖中的文件語言,這裡我們選擇更多語言
這裡我們選擇簡體中文和英語,當然我們可以勾選更多不同的語言。點選確定。
點選檔案--另存為--word2003。