「日本語処理の注意」の版間の差分
ナビゲーションに移動
検索に移動
imported>Webmaster (ページの作成:「---- <!-- カテゴリに追加するページ名を記入 --> にほんごしょりのちゅうい」) |
imported>Webmaster |
||
1行目: | 1行目: | ||
+ | == Perlによる文字操作 == | ||
+ | コンピュータでは日本語を表す(記録する)ためには、様々な規格(文字コード)が存在します。システムによってはキャラクターセット等とも言いますが、一例では以下のような規格があります。 | ||
+ | *ISO-8859-1 | ||
+ | *ISO-2022-JP | ||
+ | *Shift_JIS | ||
+ | *EUC-JP | ||
+ | *UTF-8 | ||
+ | *UTF-16 | ||
+ | 日本語などのマルチバイト文字(文字を複数のバイトで表示する)をPerlで適切に扱うに、どのような文字コードををどのような文字コードで処理して、何処のような文字コードで出力するか。を適切に行わないと「文字化け」になります | ||
+ | == 処理イメージ == | ||
---- | ---- | ||
<!-- カテゴリに追加するページ名を記入 --> | <!-- カテゴリに追加するページ名を記入 --> | ||
[[Category:Perl|にほんごしょりのちゅうい]] | [[Category:Perl|にほんごしょりのちゅうい]] |
2015年12月31日 (木) 13:09時点における版
Perlによる文字操作
コンピュータでは日本語を表す(記録する)ためには、様々な規格(文字コード)が存在します。システムによってはキャラクターセット等とも言いますが、一例では以下のような規格があります。
- ISO-8859-1
- ISO-2022-JP
- Shift_JIS
- EUC-JP
- UTF-8
- UTF-16
日本語などのマルチバイト文字(文字を複数のバイトで表示する)をPerlで適切に扱うに、どのような文字コードををどのような文字コードで処理して、何処のような文字コードで出力するか。を適切に行わないと「文字化け」になります