2008年7月2日水曜日

【文字コード】UnicodeとUTF8の違い

UnicodeとUTF8の違いが分からなかったので調べたメモ。

Unicodeは全世界の文字を共通の記法で表現しようと策定されたもの。詳しくはwikipediaで。たとえば「U+003D」というような「U+」の後ろに16進数の文字列で表現する。ちなみに「U+003D」は「=」。

UTF8はUnicodeをエンコード(符号化)(圧縮)する方法(規格)の一つ。デコード(復元)する際に負荷の高い処理が必要でないため、広く使われるようになった。詳しくはwikipediaで。
UTFは「Unicode Translation Format」の略。

時代はUnicodeらしい。Windows Vistaとの絡みが気になる人はここの特集を一読しとくといいかも。

コメントを投稿
Related Posts Plugin for WordPress, Blogger...

Blog Archives