Homebrewでpdftoppmをインストール $ brew install pdftoppmじゃなくて $ brew install poppler するらしい。 codenote.net 成功。 brew updateしたときはpyenvのpython起動しなくなるので以下対応。 zenn.dev 自作のPDF2JPGスクリプト。 $ vim mypdf2jpg.sh…
コマンドでPDFからjpgへ できるんかコレ。素晴らしい。 sips -s format png input.pdf --out output.png できた。 変更前のPDFがコレで 変更後のjpgがコレ。 jpgを「jpeg」と表記しないとコマンド通らないので注意。 sips -s format png input.jpeg --out ou…
大量のエクセルファイルを一括でPDFにしたい。 まずはコマンドだけでxlsをPDFにする。 できた。 libreoffice --headless --nologo --nofirststartwizard --convert-to pdf --outdir ./ 対象ファイル名 qiita.com これを全てのxlsxに適用する。 for i in *xls…
Adobeのサブスクリプションを、家族が契約してしまっていた。 毎月1,738円も払ってる。全く使ってないのに。 年間17,380円ものタレ流し… AdobeIDが必要(忘れた) 解約にはAdobeID(契約時に使ったメールアドレス)が必要なんだけど、そんなの忘れてしまった…
電子版法令検索サービス「e-Gov」。仕事でしょっちゅう使う。めっちゃ使いやすい。 総務省が所管だけど、作ってるのは当然総務省のアホ役人ではなくて、委託された先の民間会社。たぶんそこのエンジニアがスゴイ。いや、その業者を動かしてこのサービスを作…
2年前くらいに、自分のブログの記事をPDFにバックアップするスクリプトを書いた。 min117.hatenablog.com 年末だし。2年ぶりに全記事をバックアップする。 まずは、全ての記事のURLを取得する必要がある。Google Analyticsを使う(ブログ始めて早いうちに登…
PDFにページ番号を付与したい。ユーザー向けにマニュアルや手引きを作っている人はけっこうコレに出くわすと思う。 マニュアルは様々なファイル形式の合体で作られる。例えば本文はWord(.doc)や一太郎(.jtd)で、図はPowerPoint(.ppt)で、表はExcel(.x…
phpのソースが大きくなるとコードのどこでエラーになったか分かりにくくなる。 ソースを見る。 $ vim doLSglob.php 1700行目から1746行目までしか手を入れていないはずだけど、どこだろう… if文のカッコの対応も正しいし。間違ってないような気がする。 // …
2019年3月9日。新型コロナウイルスは日本中に蔓延。 マスクの供給不足について政府の無策を指摘した報道に対して厚生労働省が番組名を挙げて批判するという、恐ろしい事態になっている。 税金で運営される公機関であるはずの厚生労働省が「特定の番組のみ」…
PDFファイルからテキストを取り出せるらしい。 www.hiihah.info やってみる。 使う記事はこれ。 クルーズ船「ダイヤモンド・プリンセス」の扱いを誤った政府の無策により、全国にコロナウイルスが蔓延してしまった2020/2/27(木)、ときの首相が突然「来週か…
コマンド一発でテキストファイルをPDF化できるらしい。 paps コマンドでテキストファイルをいったんpsファイルに変換して、それをps2pdf コマンドに食わせることで実現できる。 テキストをわざわざPDFにして何が嬉しいの?と思うかもしれないが、実はPDFから…
世の中の気になるニュースを目にしたそのタイミングで自分のサーバに時系列に保存したい。 欲しい情報の ・URLを貼り付ければ ・PDFファイルにして ・時系列(降順)に ・サーバに保存してくれる 機能は以前実装した。こんなの。 http://min117.hatenablog.c…
仕事でtesseractを使う機会あり。面白さにハマる。 要はOCR。画像や写真に埋まっている文字列をテキストにできる。 RaspberryPiでも使えるようだ。早速試す。irukanobox.blogspot.com 環境は RaspberryPi3。raspbian。 $ uname -a あらかじめ $ sudo apt-get…
以前作った「URLからPDFを作成するスクリプト」を改良する。 min117.hatenablog.com 例えばこういう記事 https://www.buzzfeed.com/jp/saoriibuki/tokyo-uni 「がんばっても報われない社会が待っている」東大の入学式で語られたこと【全文】 のURLを貼り付け…
RaspberryPi 3 に LibreOfficeをインストールしてみる。 やりたいのはこれ。大量の xlsx ファイルを一括でPDFにしたい。 qiita.com 素晴らしい記事だ。 LibreOfficeに含まれるPDF変換機能を使って、特定のフォルダにあるエクセルファイルを一括でPDFにしてサ…
PDFファイルをJPG画像に変換するLinuxコマンド pdftoppm がかなり便利。 「PDFはPDFのまま持っておけばいいじゃん?なんでワザワザ画像に変換するの?意味あるの?」と思うかもしれないが、これが意味がある。なぜなら 画像ならAmazon Cloud Drive に容量無…
指定したURLをPDFに変換するスクリプトを、以前作った。 min117.hatenablog.com 指定したURLのタイトルをとってくるスクリプトも、さっき作った。 min117.hatenablog.com これを組み合わせて、指定したURL(引数1)をPDFに変換して、「URLの<title>名.pdf…
はてなブログの記事のタイトル部分だけをワンライナーで取得したい。ちょっと作ったらできた。早起きは三文の徳。 $ curl -s http://min117.hatenablog.com/entry/2017/07/18/213239 | egrep '.*<title>.*</title>.*' | awk -F\> '{print $2}' | awk -F\< '{print $1}' ワン…
ブログ記事数もそこそこ増えてきたけど今まで一度もバックアップを取っていない。Webサービスなんてしょせん他人のフンドシ(提供する場所)上で作っているものなので、例えばはてなブログが倒産したり、突然ブログサービスをやめたら全て消えてしまう。 信…