macOS tesseractで手書き文字認識を試す（ --psm 1 から 13 まで全部）

macOSでtesseractの文字認識を試す。基本的なことは省略。

--psm（ページセグメンテーションモード。認識精度みたいなもの？）が1から13まであるので、それぞれでどうなるか試す。

f:id:min117:20200613164646p:plain

使う画像はコレ。

f:id:min117:20200613163050j:plain

結果こうなる。

f:id:min117:20200613171056g:plain

うーん。tesseractの手書き認識は正直使いモノにならない。実用には程遠いレベル。

画像の歌詞は「よるのあと」の歌詞を手書きしたものらしい。拾いもの。

以下手順。

tesseractの --psm オプションを0から13まで回してどうなるか試した。

$ for i in $(seq -w 0 13); do echo "$i"; tesseract 20191127204158.jpg out_"$i"_ -l jpn --psm "$i"; done

f:id:min117:20200613162820p:plain

出力されるテキストのファイル名は out_psmオプション番号_.txt としている。

tesseractの書式はコレ。

tesseract 20191127204158.jpg 出力ファイル名 -l jpn --psm レベル

f:id:min117:20200613164942p:plain

結果はfor文とcatで見てみた。

$ for i in $(seq -w 1 13); do echo "$i"; cat out_"$i"*txt | head -n 30; sleep 3; clear; done

f:id:min117:20200613163632p:plain

ほかの画像でも試してみる。

min117の日記