2019年3月9日。新型コロナウイルスは日本中に蔓延。
マスクの供給不足について政府の無策を指摘した報道に対して厚生労働省が番組名を挙げて批判するという、恐ろしい事態になっている。
税金で運営される公機関であるはずの厚生労働省が「特定の番組のみ」を名指しして批判し報道を萎縮させるとは。どこかの独裁国家のようだ。安倍政権の政治が役所まで狂わせている。
ツイートでは「マスクの優先供給を行なった」と完了形で広報しているが
なんとそれは嘘だった。
公の機関が事実と異なる内容を広報し、かつ訂正もしない。
公文書ですら改ざんされる安倍政権下にあっては行政も端から腐っていくとみえる。
これに呼吸を合わせるように、自民党広報も特定の番組を攻撃している。
厚労省や自民党にとって都合の悪い報道だけをピンポイントで攻撃している。
役所や公党による、特定の報道への狙い撃ち攻撃ツイートを許してしまえば、報道は萎縮し政治に対する健全な指摘すらできなくなってしまうだろう。先の対戦はこうして大本営化していったのか。日本は再び危ない方向に向かっている。
そんな厚生労働省が、では公式ホームページではどのような情報発信をしているのか。厚労省サイトの報道発表一覧を見てみる。
https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000121431_00086.html
テキストに落とす。
$ curl https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000121431_00086.html | grep コロナ | sed -e s/'^.*href="'/''/g | sed -e s/'html.*$'/'html'/g | grep -v 415k | tee -a to_dl_kourousyou_coronavirus.txt
リストを元にPDFにする。
以前作ったスクリプトも活用する。
min117.hatenablog.com sort | uniq したリンクをsleep 60sec入れつつスクリプト食わせてPDF化する。
できた。
ここからテキストに落とす(PDF→txt)
$ for i in 20200308_*pdf; do echo "$i"; pdftotext "$i"; done
できた。
テキストの頭の6文字を取り出してみよう。
$ for i in 20200308_*txt; do echo "$i"; cat "$i" | grep -A 6 令和; echo '------------------------'; done
ふーん。途中から照会先(たぶん決裁者)が変わってるんだな。
加藤だったのが
山田に変わる。
ふーん。