將​圖​片​中​的​文​字​提​取出來​?

日常工作中,我們有時需要提取圖片或掃描件中的文字,但長篇累牘地列印,實在太慢:

1、圖片字尾是tif,需要將圖片或掃描件中的文字複製出來到word文件。

2、圖片字尾不是tif,如:jpg、jpeg、pdf、bmp等,要將圖片或掃描件中的文字複製出來到word文件。

方法:利用office或者掃描器的一些軟體,所帶有的OCR文字識別功能,通過滑鼠右鍵,或者開啟後點擊OCR轉換按鍵,進行轉換。

利用office,步驟如下:如不是tif格式,則將圖片直接另存tif格式,或者用畫圖程式開啟,另存為tif格式。雙擊該tif文件,點選"將文字傳送到word"即可。

當圖片清晰度不高,或含有手劃線及圖章等非文字圖案時,轉換後會出現亂碼,但大部分文字已經出來,其餘的工作就是修正和調整。可以設法提高圖片質量,比如:用畫圖程式去掉圖片中不需要轉換的手劃線、圖章等等非文字圖案,精簡和優化後,可以提高文字識別率,高的可達90%以上或100%。

注意:最好在安裝OFFICE時,將所有功能安裝到本地磁碟。如果OFFICE沒有安裝完全,可能因沒有OCR識別模組,而轉換不了。

另一種方法是利用掃描器驅動程式中的OCR識別軟體,安裝該軟體後,可通過右鍵轉換,步驟如下:右鍵點選jpg格式的圖片,選單出現OCR,可以“OCR成TXT文字,OCR成RTF格式的word文件,OCR成CSV格式的EXCEL文件”。對於掃描件,轉換效率可能很高;對於非掃描件,可能無法轉換,不能轉換時,則可利用OFFICE轉換。

兩種方法交替使用,應可以很大地提高工作效率。

相關問題答案