半角カナを全角カナに変換

提供: dococo wiki
2016年1月1日 (金) 14:37時点におけるimported>Webmasterによる版 (ページの作成:「windows7において半角カナから全角カナへの変換方法についていろいろ調べてみて、自分にとって使いやすいプログラムを見つけ...」)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

windows7において半角カナから全角カナへの変換方法についていろいろ調べてみて、自分にとって使いやすいプログラムを見つけたので備忘的に残しておきます
【修正ポイント】

  • \1 better written as $1のエラーのため一部修正
  • Windows標準入出力に変更

参考:404 Blog Not Found 参考:404 Blog Not Found

入力例:東京都千代田区九段南2丁目 付近 (1)
出力例:東京都千代田区九段南二丁目 付近 (一)
#!/usr/bin/perl
#ソースファイルは UTF8形式で保存
	use strict;
	use warnings;
	
	#内部処理はUTF-8で行うための宣言
	use utf8;
	use Encode;
		
	# windows標準はencoding(cp932)
	binmode STDOUT, ':encoding(cp932)'; #標準出力
	binmode STDERR, ':encoding(cp932)'; #標準エラー出力
	binmode STDIN, 	':encoding(cp932)';  #標準入出力

while (<>) {

  # 数字は半角にそろえておく
    y/1234567890/1234567890/;
  # 単独の0は「ゼロ」に書き換える
    s/(?<!\d)0(?!\d)/ゼロ/g; 
  # 桁区切りのコンマを取っておく
    s/(?<=\d),(?=(\d\d\d)+(?!\d))//g;
  # 4桁ごとに区切って万億兆を挿入
    s/(?<=\d)(?=\d\d\d\d(?!\d))/万/g;
    s/(?<=\d)(?=\d\d\d\d(?=万))/億/g;
    s/(?<=\d)(?=\d\d\d\d(?=億))/兆/g;
  # 下から1桁ずつ十百千を挿入
    s/(?<=\d)(?=\d(?!\d))/十/g;
    s/(?<=\d)(?=\d(?!\d))/百/g;
    s/(?<=\d)(?=\d(?!\d))/千/g;
  # 0になってる桁を削除
    s/0[十百千]//g;
    s/億0万/億/g;
    s/兆0億/兆/g;
    s/0//g;
  # 十百には1をつけない
     s/1([十百])/$1/g;
  # 各桁を漢数字に書き換え
    y/123456789/一二三四五六七八九/;

    print $_;
}