min117の日記

初期desireもち。趣味Mac,メインFedora,仕事xp。

RaspberryPi 画像収集APIを使って大量画像を一括ダウンロードする(Python3)

2019/1/27追記)

こっちの記事のほうが良さそう。

min117.hatenablog.com

 

 

 

Google画像検索で都度探すのが面倒なので、APIを使って画像を一気に収集したい。このへん参照。

qiita.com

d.hatena.ne.jp

まずは

f:id:min117:20170722071555p:plain

に従って words.txt imagenet.synset.obtain_synset_list をダウンロードする。

$ wget http://image-net.org/archive/words.txt

$ wget http://www.image-net.org/api/text/imagenet.synset.obtain_synset_list

次はソースをコピペする。スクリプトはこれ。

github.com

f:id:min117:20170722070732p:plain

f:id:min117:20170722070826p:plain

Python3 で書かれている。

Python のコードは字下げTABかスペースか必ずどちらかに統一しなければいけない。このコードを書いた人はTABで統一しているようだ。 

ーーー

コードの冒頭で

import PIL from Image

している。Python3.5対応の画像処理ライブラリ Pillow(PIL)なるものをインストール必要らしい。

Python 3.5 対応画像処理ライブラリ Pillow (PIL) の使い方 - Librabuch

sudoしないで、ユーザーpiのままインストールしてよいようだ。

$ pip install pillow

f:id:min117:20170722071339p:plain

画像一括ダウンロードしてみる。冒頭サイトには

f:id:min117:20170722072014p:plain

とあるので、そのまま実行してみる。

f:id:min117:20170722072214p:plain

しっかり動いた。word.txt にある単語で画像を大量収集 するらしい。

f:id:min117:20170722072500p:plain

accompanist(伴奏者)

f:id:min117:20170722072908p:plain

素晴らしい。wordlist.txt に、欲しい単語を突っ込んでスクリプトを流しておけば、関連するのをガバっといけるわけだ。しばらく試す。