「日本語処理の注意」の版間の差分

提供: dococo wiki
ナビゲーションに移動 検索に移動
imported>Webmaster
(ページの作成:「---- <!-- カテゴリに追加するページ名を記入 --> にほんごしょりのちゅうい」)
 
imported>Webmaster
1行目: 1行目:
 +
== Perlによる文字操作 ==
 +
コンピュータでは日本語を表す(記録する)ためには、様々な規格(文字コード)が存在します。システムによってはキャラクターセット等とも言いますが、一例では以下のような規格があります。
 +
*ISO-8859-1
 +
*ISO-2022-JP
 +
*Shift_JIS
 +
*EUC-JP
 +
*UTF-8
 +
*UTF-16
 +
日本語などのマルチバイト文字(文字を複数のバイトで表示する)をPerlで適切に扱うに、どのような文字コードををどのような文字コードで処理して、何処のような文字コードで出力するか。を適切に行わないと「文字化け」になります
 +
== 処理イメージ ==
 
----
 
----
 
<!-- カテゴリに追加するページ名を記入 -->
 
<!-- カテゴリに追加するページ名を記入 -->
 
[[Category:Perl|にほんごしょりのちゅうい]]
 
[[Category:Perl|にほんごしょりのちゅうい]]

2015年12月31日 (木) 13:09時点における版

Perlによる文字操作

コンピュータでは日本語を表す(記録する)ためには、様々な規格(文字コード)が存在します。システムによってはキャラクターセット等とも言いますが、一例では以下のような規格があります。

  • ISO-8859-1
  • ISO-2022-JP
  • Shift_JIS
  • EUC-JP
  • UTF-8
  • UTF-16

日本語などのマルチバイト文字(文字を複数のバイトで表示する)をPerlで適切に扱うに、どのような文字コードををどのような文字コードで処理して、何処のような文字コードで出力するか。を適切に行わないと「文字化け」になります

処理イメージ