min117の日記

初期desireもち。趣味Mac,メインFedora,仕事xp。

Twitterのタグ「#名刺代わりの映画10選」でツイートされたオススメ映画をファイルに一括出力する(Python3)

前回、ツイッターで面白いタグを見つけた。

min117.hatenablog.com

映画ファンが面白い映画を「#名刺代わりの映画10選」として紹介してくれている。つぶやきには文字数制限あるからかネタバレが無いし、けっこうアタリの映画が多い。

 

せっかくこんな面白いタグなのだからオススメされた映画ツイートを一括で取得して一覧ファイルに出力したい。ついでにオススメ数も取得したい。Python3 bashでササッと組む

Python で TwitterAPI を使う方法はこのへん参照。

qiita.com

 

 

できた。Python3 PATHが通っている前提。

$ vim ./getTW02_キーワードサーチ.py

f:id:min117:20180507200010p:plain

実行してみる。

$ ./getTW02_キーワードサーチ.py

f:id:min117:20180507204718p:plain

検索ワードを聞かれるので

f:id:min117:20180507204826p:plain

シャープを含んだ検索タグを記載する。

f:id:min117:20180507204905p:plain

オススメの結果がズラリと並ぶ。

f:id:min117:20180507195131p:plain

ツイッターにつぶやくほどコアな映画ファンが選んだオススメ映画だけの一覧になる。めっちゃ便利だこれ。

 

 

 

出力されたオススメ映画を、bashtee コマンドにパイプしてファイルに落とす。

$ ./getTW02_キーワードサーチ.py | tee -a eiga10.txt

 

出力されたファイルをvimで開いてみる。

$ vim eiga10.txt

f:id:min117:20180507205107p:plain

素晴らしい。実行によって1回で取得できるツイートは100件(API制限)なので、1件につき10個オススメが呟かれたとして全体で1000個を超えるオススメがされている。

f:id:min117:20180507210145p:plain

 

 

あとはこれを sort (並べ替え)し uniq -c(名前のカブリを排除 かつ カウントされた数を表示)するパイプに通して整理してみる。

$ cat eiga10.txt | sort | uniq -c

f:id:min117:20180507210718p:plain

結果が出た。タイトルの前にある数字がオススメ数(多いほどオススメ)「テラビシアに架ける橋」「ディーバ」など、聞いたこともないタイトルの映画が並ぶ。

f:id:min117:20180507210804p:plain

 

最高すぎる。

<今後直したいところ>

twitterAPIでは一度に取得するツイート数の上限が限られているので(例えば50件とか)、ループで回して一度に大量(まとめて1,000件のツイート=10,000個のオススメを取得)できるようにしたい。

・そのために「前回取得したツイートの内容を覚えておき、その続きから」取得できるようにしたい。

このへんが参考になりそう。

qiita.com

次回に続く。