min117の日記

初期desireもち。趣味Mac,メインFedora,仕事xp。

景気ウォッチャーで自然言語処理入門 の真似事(bash+mecabで単語分析)

景気ウォッチャーで自然言語処理入門

面白そうだったので参加。オンラインの無料勉強会。

140人もいたのか。

基本Zoom(じゃなくてBrave Talks)というオンライン会議ツールで参加。

ビデオも音声もOff。聞いてるだけでOK。

 

景気ウォッチャーとは

ほうほう。

www5.cao.go.jp

 

これの、例えば「東北」を開いてみると

こう。

 

これのCSVである watcher4.csv(景気判断理由集・現状)に目を付ける。

 

ちなみに発表者のPython分析はコレ。凄すぎ。

 

すぐにはとても真似できんので、こっちはbashmecab遊んでみる。

 

mecabは前にインストールした。

min117.hatenablog.com

 

wathcer4.csv各月分ダウンロードして加工して比較してみる

 

$ wget http://www5.cao.go.jp/keizai3/2022/0708watcher/watcher4.csv -P data/220708/

$ cd /data/220708/

$ cat watcher4.csv | nkf -wLux | tee -a watcher4_utf8.csv

$ tt=watcher4_utf8.csv && cat "$tt" | mecab -d "/usr/lib64/mecab/dic/mecab-ipadic-neologd/" | grep  名詞 | awk -F名詞 '{print $1}' | sort | uniq -c | sort -k 1 | tee -a mymecab02_$(basename `pwd`)_"${tt%%.csv}".txt

 

こうなる

 左:2022/8月の単語の出現数

 右:2022/7月の単語の出現数

比べると例えば

・「新型コロナウイルス」という単語が登場するのは左(8月)のほうが多い(=上位)だと分かる。

・「客」とか「お客様」の登場順は8月のほうが減ってしまった。

・「求人」の出現順位も8月は下がってしまった。

と分かる。

 

これをコロナの感染者数グラフと比べてみると…確かに8月に激増している。

こりゃ宿泊客もキャンセルしただろうなーと思って

・「キャンセル」という単語を調べるとやはり8月に一気に出現数激増しているのも見てとれる。

ほかにも例えば

・「クーポン」という単語が8月には無くなった(7月はあった)

とか分かる。

面白いぞこれ。

 

例えば

grep 一般小売 とかやったら業態別に分析できる。

 

$ tt=watcher4_utf8.csv && cat "$tt" | egrep '.*一般小売.*' | mecab -d "/usr/lib64/mecab/dic/mecab-ipadic-neologd/" | grep  名詞 | awk -F名詞 '{print $1}' | sort | uniq -c | sort -k 1 | tee -a mymecab02_$(basename `pwd`)_kouri_"${tt%%.csv}".txt

これ色々先読みできるんじゃ?

 

watcher4_utf8.csv頭の12行は不要なので読み飛ばす必要列だけに絞るとかして精度上げる。

$ tt=watcher4_utf8.csv && tail -n +12 "$tt" | awk -F, '{print $6}' | sed -e s/"^\n"/""/g | sed -e s/"^−.*$"/""/g | mecab -d "/usr/lib64/mecab/dic/mecab-ipadic-neologd/" | grep  名詞 | awk -F名詞 '{print $1}' | sort | uniq -c | sort -k 1 | tee -a mymecab03_$(basename `pwd`)_"${tt%%.csv}".txt

楽しい。いろいろ試す。

 

その買うを、もっとハッピーに。|ハピタス

 

 

 

 

チャイニーズ・ダイスを振って生きて行く=その日の運命に任せて生きていく

 

その日の運命に任せて生きていく

チャイニーズ・ダイスをふって
生きてくふたりの夢を
誰もがいつだって 笑いとばした
"I love you"あいつのセリフ
かすんでしまうぐらいに
疲れきった ふたりが悲しいね

www.youtube.com

もし俺がヒーローだったら

悲しみを近づけやしないのに…

そんなあいつの つぶやきにさえ

うなずけない 心がさみしいだけ

 

 

いつ聞いても歌詞に力があるね。あの頃の歌は。

 

その買うを、もっとハッピーに。|ハピタス

 

 

 

 

ハピタスポイント1,857ptをビットコインに変換する(1BTC=281万円前後)2022/08/31

ハピタスのポイントビットコインに換えることができる。

ブロンズ会員なので0.3%バックもあっていい感じ。

 

その買うを、もっとハッピーに。|ハピタス

本日の1BTCは約218万円。2022/08/31。月末。

本当はこないだ(279万円くらいのとき)に交換したかったが。

 

交換申請する。

ポイント交換申請はスマホでしかできないらしい。

 

パソコンで交換申請→確認メールをスマホgmailで受け取り→そこに書いてるリンクを開く、しても「このリンクは無効」と言われてしまう。

 

スマホgmailで交換申請→確認メールをスマホgmailで受け取り→そこに書いてるリンクを開けばOK。

 

小さいが、本日の交換レートは(1,800ポイント=1,800円分で0.00003439BTCらしい。

 

1,800ptを交換に出す。

ハピタスの手数料は無料だが

ビットフライヤー側の手数料はガッツリ取られる(なのでレートが悪い)。

 

 

交換完了。

 

交換前。

 

交換後。

 

総資産の変化。

1,800円分交換したのに、1,732円しか増えていない。bitFlyerの手数料が68円分取られている。

 

手数料の率は?

約3.8%。たっか。4%近く持って行かれてしまう。100万円交換したら4万円はbitFlyerに中抜きされるってことだ。

 

その買うを、もっとハッピーに。|ハピタス

 

 

 

 

ドコモ5Gホームルーター+楽天UN-LIMITを固定回線に使う(都心で)という選択

前に契約してすぐ解約したドコモ5Gホームルーター

東京都心生活になったので楽天UN-LIMIT挿してどれくらいスピード出るか試す。

 

5Gだったり

4Gに戻ったりするが

基本は4G。

 

速度はこんなもん。

まあ、普通に使える。

 



 

 

 

 

その買うを、もっとハッピーに。|ハピタス

Panasonic Let's Note NX4 をHDDからSSDに換装(macOSのddコマンドは止めてAOMEI Backupperを使ってパーティション指定でコピる)

 

HDDをSSDに換装

やろうやろうと思ってずっと先延ばしだったが今日こそやる。

以前にも同じことしたしすぐできるだろう。

min117.hatenablog.com

 

対象はこれ。Panasonic Let's Note NX4。

 

部品たちはこれ。

 

買ったのに使ってなかった。

 

macOSで作業する。

 

ザクっと挿してチカチカ。

 

 

 

macOSのddコマンドでやりかけたけど、もとい。

それだと300GBのHDDから吸い出すのに、ほんとに300GB必要になっちゃう。

 

コピーしたいPC(Win10)では、300GBのHDDのうち142GBしか使ってないんだから、142GBだけコピれればいい。

 

そういうときは専用ソフトに任せる。

この手順。コピーしたいパーティションだけ選んでバックアップできる。

min117.hatenablog.com


今回はCドライブしかないディスク丸ごとコピるので、パーティション指定じゃなくドライブ指定でバックアップした。

140GBがものの30分くらいで終わりそうな速度。ddより遥かに速いじゃないか。

 

バックアップは無事完了。

しかしWindowsがコピー先のディスク認識していない…再起動。

 

おっしゃキタ。

しかし下の薄い字でコメントが。要はGPTじゃなくてMBRっぽいけど起動できなくなるぜ!気をつけな!的な。

 

コマンドラインでMBR2GPTできるらしい。

www.billionwallet.com

 




 

 

コピー元のCドライブが298GBもあるから、コピー先の240GBに入らない。

 

ボリュームの縮小してコピーするパーティション領域減らすことにする。

 

縮小する領域のサイズ=コピー後のDドライブになる(空き)領域

デフォで140130MBと出た。つまり136GB

 

コピー元HDD:全体320GB

うちOSで使用:50GBくらい

 

コピー先SSD:240GB

Dに割り当てたい:136GB

Cに割り当てたい:240GB - 136GB = 104GB

いい感じじゃん。

 

実行

コピー元HDD(分割後):全体320GB

うちOSで使用:50GBくらい

↑含むCドライブ:160.06GB

分割後のDドライブ:136.85GB。

よし。

これでもっかいコピる。

 

 

 

 

コピーはできたが起動できず。

起動ディスクつくってBOOT領域をFIXするしかないか…

今回はCDじゃなくてUSBで起動ディスク作って試してみる。

次回に続く。

 

 

 

その買うを、もっとハッピーに。|ハピタス

Excel「100%積み上げ棒グラフ→行列の入替え」でEDINETの決算情報から貸借対照表を可視化する

 

積み上げグラフ→行列入替え

こういうグラフが作れるらしい。

貸借対照表の主要なところを取ってきてる。

キャッシュを全部はたいても借金を返せない経営状態だとわかる。

 

グラフの元データはこれ。

右側(RESERVE側)の見出しと数字を全部選択した状態で、挿入→グラフ→100%積み上げ棒グラフ→行列入替えするとできる。

 

さらに元データはこれ。EDINETから取得した貸借対照表データ(XBRL形式)Excelで開いて、集計したい項目に集計キーを振ったのをSUMIF関数で集計しただけ。

 

EDINETはこれ。

検索した会社のXBRLデータを落とせばいい。

 

同じことをExcelじゃなくてPythonで自動化できないか。あとで試す(グラフも自動で作りたい)

 

雑誌でみかけたコレもあとで作ってみる。



 

 

 

 

その買うを、もっとハッピーに。|ハピタス

python3 matplotlibのグラフで豆腐の文字化け解消するには import japanize-matplotlib

 

日本の株価グラフ

 

左上の摘要欄(bbox)の日本語が化ける。

9107.T を「川崎汽船」に変えたら豆腐に文字化けした。

 

japanize-matplotlib入れれば解消する

 

インストールするときはハイフン

$ pip3 install japanize-matplotlib

 

使うときはアンダーバー

import japanize_matplotlib

m

 

完成

 

 

 

 

 

その買うを、もっとハッピーに。|ハピタス