pdf存有豐富的資料,一些文字資料想借用一下,一個個打字的話那可是不小的工程呢,可是有時候想複製一下文字,怎麼也複製不了,下面分享一種複製pdf資料的文字的方法。
工具/原料
pdf文件
CAJViewer軟體
方法/步驟
有些pdf資料是可以直接用pdf閱讀器的工具選擇好文字,然後複製即可,或者直接另存為.txt格式的文字也可以,因為這種pdf資料本身是由word或者wps等文件編輯軟體生成的。
但是像這種用掃描圖書或者直接用圖片合成的pdf資料,用選擇複製就無效果了,另存為txt文件只能得到一個空文件。
這裡介紹一個可以圖片識別文字的軟體,CAJViewer。軟體其它功能就不細說了,只說明一下它是怎麼識別pdf圖片文字的
用CAJViewer軟體開啟一個pdf資料文件,選擇工具選單下面的文字識別選項。
然後用滑鼠畫一個矩形框選你要轉成文字的圖檔內容。
滑鼠放開後,軟體經過幾秒的計算後便彈出一個“文字識別結果”的視窗,我們可以對比看一下,它中文的識別正確率還是挺高的,字母跟數字有時候會識別亂碼。但是這已經算不錯了,copy到你要編輯的文件在修正一下即可,總比一字一字敲鍵盤要快一些。
另外說明一點的是,因為常規格式的檔案裡面,CAJViewer軟體只能讀pdf文件,如果你的資料是圖片的,可以先用ps或者別的軟體轉為pdf文件,在用CAJViewer來識別文字。
注意事項
軟體總是有缺點的,如果覺得這樣更麻煩,還是用鍵盤打字吧。
如果圖檔解析度低,或者不清晰,識別率是很低的,不用依靠軟體了,軟體是永遠比不上人的。