2019/1/27追記)
こっちの記事のほうが良さそう。
Google画像検索で都度探すのが面倒なので、APIを使って画像を一気に収集したい。このへん参照。
まずは
に従って words.txt と imagenet.synset.obtain_synset_list をダウンロードする。
$ wget http://image-net.org/archive/words.txt
$ wget http://www.image-net.org/api/text/imagenet.synset.obtain_synset_list
次はソースをコピペする。スクリプトはこれ。
Python3 で書かれている。
Python のコードは字下げをTABかスペースかの必ずどちらかに統一しなければいけない。このコードを書いた人はTABで統一しているようだ。
ーーー
コードの冒頭で
import PIL from Image
している。Python3.5対応の画像処理ライブラリ Pillow(PIL)なるものをインストール必要らしい。
Python 3.5 対応画像処理ライブラリ Pillow (PIL) の使い方 - Librabuch
sudoしないで、ユーザーpiのままインストールしてよいようだ。
$ pip install pillow
画像一括ダウンロードしてみる。冒頭サイトには
とあるので、そのまま実行してみる。
しっかり動いた。word.txt にある単語で画像を大量収集 するらしい。
accompanist(伴奏者)
素晴らしい。wordlist.txt に、欲しい単語を突っ込んでスクリプトを流しておけば、関連するのをガバっといけるわけだ。しばらく試す。