min117の日記

初期desireもち。趣味Mac,メインFedora,仕事xp。

コロナウイルスに関する記事をPDFにする

2019年3月9日。新型コロナウイルスは日本中に蔓延。

 

マスクの供給不足について政府の無策を指摘した報道に対し厚生労働省が番組名を挙げて批判するという、恐ろしい事態になっている。

f:id:min117:20200309002120p:plain

 

税金で運営される公機関であるはずの厚生労働省「特定の番組のみ」を名指しして批判し報道を萎縮させるとは。どこかの独裁国家のようだ。安倍政権の政治が役所まで狂わせている

 

f:id:min117:20200309002946j:plain  f:id:min117:20200309002951j:plain

ツイートでは「マスクの優先供給を行なった」と完了形で広報している

 

f:id:min117:20200309002956j:plain

 

なんとそれは嘘だった

www.huffingtonpost.jp

 

公の機関が事実と異なる内容を広報し、かつ訂正もしない

f:id:min117:20200309004053p:plain

公文書ですら改ざんされる安倍政権下にあっては行政も端から腐っていくとみえる。

 

これに呼吸を合わせるように、自民党広報も特定の番組を攻撃している。

f:id:min117:20200309002908j:plain f:id:min117:20200309002915j:plain

 

厚労省自民党にとって都合の悪い報道だけをピンポイントで攻撃している。

lite-ra.com

役所や公党による、特定の報道への狙い撃ち攻撃ツイートを許してしまえば、報道は萎縮し政治に対する健全な指摘すらできなくなってしまうだろう。先の対戦はこうして大本営化していったのか。日本は再び危ない方向に向かっている。

 

 

そんな厚生労働省が、では公式ホームページではどのような情報発信をしているのか。厚労省サイトの報道発表一覧を見てみる。

https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000121431_00086.html

www.mhlw.go.jp

 

テキストに落とす。

$ curl https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000121431_00086.html | grep コロナ | sed -e s/'^.*href="'/''/g | sed -e s/'html.*$'/'html'/g | grep -v 415k | tee -a to_dl_kourousyou_coronavirus.txt

 

リストを元にPDFにする。

min117.hatenablog.com

 

以前作ったスクリプトも活用する。

min117.hatenablog.com sort | uniq したリンクをsleep 60sec入れつつスクリプト食わせてPDF化する。

 

 

できた。

f:id:min117:20200309010044p:plain

f:id:min117:20200309010146p:plain

f:id:min117:20200309010228p:plain


ここからテキストに落とす(PDF→txt)

$ for i in 20200308_*pdf; do echo "$i"; pdftotext "$i"; done

f:id:min117:20200309005904p:plain

できた。

min117.hatenablog.com

 

テキストの頭の6文字を取り出してみよう。

$ for i in 20200308_*txt; do echo "$i"; cat "$i" | grep -A 6 令和; echo '------------------------'; done

 

ふーん。途中から照会先(たぶん決裁者が変わってるんだな。

f:id:min117:20200309010758p:plain

加藤だったのが

f:id:min117:20200309010845p:plain

山田に変わる。

f:id:min117:20200309010912p:plain

ふーん。