ツイッターで見かけたニュース。258億語の日本語を使った検索システム「梵天」が一般公開されるらしい。
記事中に MeCab の記載あり。以前から気になっていたので、RaspberryPi3 にインストールしてみる。
インストール方法は書籍「シェルプログラミング実用テクニック」の p82 にあったのでそのままやってみる。
$ sudo apt-get -y install mecab libmecab-dev
$ sudo apt-get -y install mecab-ipadic-utf8
インストールされた。
上記書籍にある例のとおり使ってみる。
$ echo 私の血にはシェルが混ざっています。 | mecab
これはすごい。例えば名詞だけ抜き出したければ、mecabとgrepを合わせればいいわけだ。
$ echo 私の血にはシェルが混ざっています。 | mecab | grep 名詞
すごい。これ、仕事でシステム統合するときに、例えば患者マスタの名寄せしたり姓名分割したりに使えるんじゃないの?後でいろいろ試す。