macOSでtesseractの文字認識を試す。基本的なことは省略。
--psm(ページセグメンテーションモード。認識精度みたいなもの?)が1から13まであるので、それぞれでどうなるか試す。
使う画像はコレ。
結果こうなる。
うーん。tesseractの手書き認識は正直使いモノにならない。実用には程遠いレベル。
画像の歌詞は「よるのあと」の歌詞を手書きしたものらしい。拾いもの。
以下手順。
tesseractの --psm オプションを0から13まで回してどうなるか試した。
$ for i in $(seq -w 0 13); do echo "$i"; tesseract 20191127204158.jpg out_"$i"_ -l jpn --psm "$i"; done
出力されるテキストのファイル名は out_psmオプション番号_.txt としている。
tesseractの書式はコレ。
tesseract 20191127204158.jpg 出力ファイル名 -l jpn --psm レベル
結果はfor文とcatで見てみた。
$ for i in $(seq -w 1 13); do echo "$i"; cat out_"$i"*txt | head -n 30; sleep 3; clear; done
ほかの画像でも試してみる。