min117の日記

初期desireもち。趣味Mac,メインFedora,仕事xp。

テキスト処理/txt

あるファイル(myData.csv)が作成されたかをモニタリングするWindowsバッチ

// 仕事では Windows7 を使っている。ネットワーク上(NAS)にあるファイル myDATA.csv は、他の部署(の他のシステム)から不定期に吐き出されるので、作成されたかどうかをわざわざ確認しなければならない。 面倒なので、ファイルが存在するかどうか確認す…

vim キャプチャした文字列の一部を使って置き換えるホールドバッファ機能 :%s/\(¥[1-9]\),/\1/g

// カンマ区切りのcsvファイルがある。 金額の区切りもカンマになってしまっていてawkで扱いにくい。 金額の区切りのカンマだけ無くしたい。 1行目で言えば ¥8,163 を ¥8163 にしたい。 /¥[1-9], とやってキャプチャできるけど、一括置換ではフィールド区切…

bash 「複数のShift-JISファイル(csvとpyとbat)をnkfで変換してファイル名の末尾に_utf8をつけて保存する」をワンライナーでやる

Windowsで作ったShift-JISのファイルがある。拡張子がバラバラだ。csvとpyとbatが混在している。 これを全部utf-8に変換し、かつファイル名の末尾に_utf8をつけるをコマンド一発でやりたい。最終的にこうなる。 たとえば「DB.csv」を「DB_utf8.csv」に変換す…

PHP フォルダ内の全てのテキストファイルの中身を1ページ内にまとめて表示する

Apacheで公開している自宅サーバのフォルダ内に、複数のテキストファイルがある。 全てのテキストファイルの中身を確認したい。1つ1つ開いていくのは大変なので、index_txt.php をクリックするだけで、全てのテキストファイルの内容を1ページに表示できるよ…

bash フォルダ内のテキストファイルの文字コードを一発で調べるコマンド

テキストファイルが4つあるが、このうち1つだけが文字コードが違っている。 $ ls -shal それぞれのファイルの文字コードを、コマンド1行(ワンライナー)で調べる。 $ for i in *txt; do echo "$i"; nkf -g "$i"; echo ===== ; done 一つだけ Shift-JIS が混…

RaspberryPi 3 形態素解析エンジンMeCabをインストールする

ツイッターで見かけたニュース。258億語の日本語を使った検索システム「梵天」が一般公開されるらしい。 internet.watch.impress.co.jp 記事中に MeCab の記載あり。以前から気になっていたので、RaspberryPi3 にインストールしてみる。 インストール方法は…