使用jTessBoxEditor生成tesseract-orc的字典?

Tags: 圖片, 字典,

使用tesseract-orc時生成字典是很多人頭疼的事,下面演示下簡單的方法

看圖片操作即可

方法/步驟

選擇 tif 檔案,然後執行“Make Box File only”然後點選 “Run”

使用jTessBoxEditor生成tesseract-orc的字典

等待BOX檔案生成完畢,然後使用 Box Editor 進行校正,這裡就不演示校正過程了

使用jTessBoxEditor生成tesseract-orc的字典

選擇“Train With Existing Box”並點選“Run”

使用jTessBoxEditor生成tesseract-orc的字典

會提示缺少3個檔案

使用jTessBoxEditor生成tesseract-orc的字典

手動建立這3個檔案,使用文字檔案改名即可,注意看清楚字尾名“.txt”必須刪除

使用jTessBoxEditor生成tesseract-orc的字典

修改 “CK.font_properties”檔案,輸入如下內容“CK 0 0 0 0 0",然後儲存

使用jTessBoxEditor生成tesseract-orc的字典

再次點選“Run”

使用jTessBoxEditor生成tesseract-orc的字典

等待字典生成完畢,就可以了

使用jTessBoxEditor生成tesseract-orc的字典

相關問題答案