min117の日記

初期desireもち。趣味Mac,メインFedora,仕事xp。

RaspberryPi 3 形態素解析エンジンMeCabをインストールする

ツイッターで見かけたニュース。258億語の日本語を使った検索システム「梵天」が一般公開されるらしい。

internet.watch.impress.co.jp

記事中に MeCab の記載あり。以前から気になっていたので、RaspberryPi3 にインストールしてみる。

f:id:min117:20170306211850p:plain

インストール方法は書籍「シェルプログラミング実用テクニック」の p82 にあったのでそのままやってみる。

$ sudo apt-get -y install mecab libmecab-dev

$ sudo apt-get -y install mecab-ipadic-utf8

f:id:min117:20170306211646p:plain

インストールされた。

f:id:min117:20170306212247p:plain

上記書籍にある例のとおり使ってみる。

$ echo 私の血にはシェルが混ざっています。 |  mecab

f:id:min117:20170306212400p:plain

これはすごい。例えば名詞だけ抜き出したければ、mecabgrepを合わせればいいわけだ。

$ echo 私の血にはシェルが混ざっています。 |  mecab | grep 名詞

f:id:min117:20170306212546p:plain

すごい。これ、仕事でシステム統合するときに、例えば患者マスタの名寄せしたり姓名分割したりに使えるんじゃないの?後でいろいろ試す。