min117の日記

初期desireもち。趣味Mac,メインFedora,仕事xp。

Python3 「API を叩かずに Google から画像収集をする」を試す

コマンド一発で画像を集めたい。Google検索で。

素晴らしい記事を発見。

qiita.com

 

これ。素晴らしすぎる。

f:id:min117:20190127225151p:plain

APIいらない。

 

<結論>

やりたいのはこれ。

検索文字列枚数を指定して画像検索+保存する。

 

$ python image_collector_cui.py 'トクサツガガガ ドラマ'  20

f:id:min117:20190127232630p:plain

結果はこう。

f:id:min117:20190127233707p:plain

ブラウザから見てみるとこう。

f:id:min117:20190127232715p:plain

画像一覧にするとこう。

f:id:min117:20190127231702p:plain

 

環境は Python3

f:id:min117:20190127225420p:plain

 

コードは記事そのまま写経。

$ vim image_collector_cui.py

f:id:min117:20190127225527p:plain

ただし、分かりにくいところや自分がつまづいたところだけは シャープ3つでコメントつけた。

f:id:min117:20190127232119p:plain

f:id:min117:20190127232148p:plain

<間違ったところmemo>

・7行目は requests108行目は request(sなし

 → 108行目はsつけてもエラーが出ないがダウンロードが0件になってしまう

・14行目は「57.0」にしといたほうがよい?

・31行目のカッコとじ

・93行目のdata を date にしない。

・94行目のexistの綴り注意(exit、existsは誤り)

 

<今後試すこと>

画像サイズ「大」にした検索(アドバンストサーチ)での画像保存

・通常の検索(文字検索)結果の取得

サジェストでの検索結果の取得

 

qiita.com

github.com

github.com

https://raw.githubusercontent.com/nazboost/image-collector/master/image_collector_cui.py

 

f:id:min117:20190128000216p:plain

f:id:min117:20190128000223p:plain

 

追記)lxmlでエラーがでるときはpipでインストールする

f:id:min117:20191110115154p:plain

$ pip3 install lxml

f:id:min117:20191110115417p:plain

qiita.com

f:id:min117:20191110115209p:plain