2009年6月12日金曜日

文字コードとは何ですか?

Webサイトの文字がわけの分からない記号になって
しまう文字化けは、ブラウザがWebサイトで使われて
いる文字コードを正しく認識できなかったことが原因で
起きるるそうです。

コンピューターが使う文字は、文字コードと呼ばれる
数値として扱われています。

OSごとに文字コードが異なる時代もあったそうですが
現在では次の4種類の文字コードがOSに関係なく広く
使われているようです。
↓↓
・Shift-JIS(シフトジス)
・ISO-2022-JP(アイエスオー2002ジェイピー)
・EUC-JP(イーユーシージェイピー)
・UTF-8(ユーティーエフ8)

Sift-JISは、Windowsのメモ帳を始めとした日本語対応
アプリケーションで使われています。

ISO-2022-JPは、主に電子メールで使われていると
いうことです。

EUC-JPは、UNIXやLinux環境で広く使われている
そうです。

UTF-8は、Unicodeとも呼ばれ、現在はブログを中心に
広く使われているそうです。

HTMLでは、互換性を保つために、使っている文字
コードをHTMLファイルの中で宣言しなければなりま
せん。文字コードを宣言しなかったり宣言が間違って
いたりすると文字が正しく表示されないことがあります。

よく見る文字化けがその例な訳ですね。

0 件のコメント:

コメントを投稿