curlでEUC-JPのサイトをUTF-8に変換してファイルにダウンロードする
curlでページをファイルにダウンロード
文字コードがutf-8のサイトならこれだけ。
1 |
$ curl https://example.com/ > sample.html |
文字コードがeuc-jpだと文字化けするのでiconv(文字コードを変換)をかませる。
1 2 3 4 5 |
$ curl https://example.com/ | iconv -f EUCJP -t UTF8 > sample.html オプション -f: --from-code= -t: --to-code= |
検索結果のページなどでパラメーターがたくさんついているurlでは&を”&”と文字列として指定してやる。
1 |
$ curl https://example.com/search?name=hoge"&"age=35"&"sex=male > sample.html |
コメント
コメントはありません。