min117の日記

初期desireもち。趣味Mac,メインFedora,仕事xp。

RaspberryPi3 Python3 + NumPy でコサイン類似度を計算する(協調フィルタリング)

面白い記事があったで雑誌を買ってしまった。紙媒体で欲しいと思ったのは久しぶり。

使える数学という特集で、とても分かりやすく数学を書いていた。こういう記事なら買ってでも読む価値がある。

 

コサイン類似性、協調フィルタリングについての内容は特に興味深く読んだ。

f:id:min117:20180703005150p:plain

 

で、Webで「cos類似度」で探してみると、面白そうな内容がある。

Python + numpy で cos 類似度の計算 · GitHub

gist.github.com

PythonとNumPyがあればコサイン類似度を計算できるらしい。さっそくやってみる。

 

まずは NumPy をインストールする。

$ pip install numpy

f:id:min117:20180703010609p:plain

 

あとは上記サイトのソースそのまま進める。python3で試す。

$ vim cos_sim.py

f:id:min117:20180703010705p:plain

 

ソースもprint文だけは python3に合わせてカッコでくくった。

f:id:min117:20180703010913p:plain

 

実行してみる。

f:id:min117:20180703065742p:plain

 

こんな計算が誰でも手軽に手元でできるとは。Python最高だ。色々試す。