無窮 i ラボ Blog

知的ネット社会、知そのもの、機械との共生、プログラミングに関して。

 
 

UTF-8 で書かれたファイル hogehoge_UTF8.txt から、バッチファイル(.bat)に書かれた以下のコマンドで、内容を euc-jp にエンコードしファイル hogehoge_EucJp.txt を作成できる。

perl encode_utf8_to_euc-jp.pl < hogehoge_UTF8.txt > hogehoge_EucJP.txt

encode_utf8_to_euc-jp.pl

use Encode qw/ encode /;
use Encode qw/ decode_utf8 /;

@data = <STDIN>;

# http://blog.livedoor.jp/sasata299/archives/51186273.html
# http://d.hatena.ne.jp/kopug/20060903
foreach $ele (@data) {
$ele = decode_utf8($ele);
$ele =~ tr/[\x{ff5e}\x{2225}\x{ff0d}\x{ffe0}\x{ffe1}\x{ffe2}]/[\x{301c}\x{2016}\x{2212}\x{00a2}\x{00a3}\x{00ac}]/;
$ele = encode('euc-jp', $ele);
}

print @data;

なお、私は encode_utf8_to_euc-jp.pl をeuc-jpで保存している。
スポンサーサイト
 このエントリーをはてなブックマークする このエントリーを含むはてなブックマーク  
  
 
 
■  ■  ■

 
本文へは上スクロールしてください

関連:
Encode.pm を使って、バッチファイルからエンコードする
http://nhm.blog75.fc2.com/blog-entry-540.html

2012.09.15 22:46 URL | TAKAGI-1(Admini) #cAPDhLHE [ 編集 ]












管理者にだけ表示

トラックバックURL↓
http://nhm.blog75.fc2.com/tb.php/543-a9d9f63d

新しいトラックバックほど上に表示されます。