使用tesseract-orc時生成字典是很多人頭疼的事,下面演示下簡單的方法
看圖片操作即可
方法/步驟
選擇 tif 檔案,然後執行“Make Box File only”然後點選 “Run”
等待BOX檔案生成完畢,然後使用 Box Editor 進行校正,這裡就不演示校正過程了
選擇“Train With Existing Box”並點選“Run”
會提示缺少3個檔案
手動建立這3個檔案,使用文字檔案改名即可,注意看清楚字尾名“.txt”必須刪除
修改 “CK.font_properties”檔案,輸入如下內容“CK 0 0 0 0 0",然後儲存
再次點選“Run”
等待字典生成完畢,就可以了