きゃりーぱみゅぱみゅのラジオ面白い。探したい。何時から始まるか全国すべてのラジオ局の番組表から探したい。
まずは指定したラジオ局の番組表を取得するスクリプト作った。
$ vim myradikoBANGUMI.sh
curlをラップしてるだけ。
こんな感じで使う。
$ ./myradikoBANGUMI.sh FMFUKUI | grep -B 1 きゃりー
全国のラジオ局の一覧はcurlで取得。
curl -s http://radiko.jp/index/ | grep href | awk -Findex/ '{print $2}' | awk -F\" '{print $1,$2}' | awk -F\> '{print $1,$2}' | sed -e s/'<\/a'/''/g | sed -e s/'\/'/''/g
コマンド myradikosearchChannel を叩けばイッパツで局一覧を取得できるようにaliasに書く。
$ vim ~/.bashrc
alias myradikosearchChannel='curl -s http://radiko.jp/index/ | grep href | awk -Findex/ '\''{print $2}'\'' | awk -F\" '\''{print $1,$2}'\'' | awk -F\> '\''{print $1,$2}'\'' | sed -e s/'\''<\/a'\''/'\'''\''/g | sed -e s/'\''\/'\''/'\'''\''/g'
局一覧すべてに対して番組表を取得にいく。for文で回す。
L=myradikolistKARRY3.txt; for i in $(myradikosearchChannel | awk '{print $1}'); do echo "$i" | tee -a "$L"; ./myradikoBANGUMI.sh "$i" | grep -B 1 きゃりー | tee -a "$L";
結果ファイルを編集する。
$ vim myradikolistKARRY3.txt
17行目、25行目 ラジオ局名
18行目、26行目 prog行 開始時刻(ft)、終了時刻(to)
これを整形してこんな感じのCSVにできれば
ラジオ曲名,開始時刻,終了時刻,ファイル名
前回作ったスクリプトで一括録音も可能なわけだ。
要らない行はvimで消す。
%s/.*desc.*gt; //g
%s/<\/imgs>//g
%s/">\n//g
%s/--//g
さらに加工。
310行目、317行目
lt から始まって gt までを消したいなぁ。vimの正規表現で最短マッチできればいいわけだ。
すげ。できた。{-} で最短マッチできるみたい。
/lt.\{-}gt;
置換する。
%s/lt.\{-}gt;//g
ここまできた。
359行目と360行目をつなげたい。
FM_OITA,202002182100,202002182130,叶美香
みたいに取り出せるといい。
cat このtxt | grep | -B 1 title
でできそう。次回まで試す。