【文字コード】UnicodeとUTF8の違い

UnicodeとUTF8の違いが分からなかったので調べたメモ。

Unicodeは全世界の文字を共通の記法で表現しようと策定されたもの。詳しくはwikipediaで。たとえば「U+003D」というような「U+」の後ろに16進数の文字列で表現する。ちなみに「U+003D」は「=」。

UTF8はUnicodeをエンコード(符号化)(圧縮)する方法(規格)の一つ。デコード(復元)する際に負荷の高い処理が必要でないため、広く使われるようになった。詳しくはwikipediaで。
UTFは「Unicode Translation Format」の略。

時代はUnicodeらしい。Windows Vistaとの絡みが気になる人はここの特集を一読しとくといいかも。

コメント

このブログの人気の投稿

【.NET】DataGridViewを選択した際に背景色を変更しない

Can't open PID file /var/run/nginx.pid (yet?) after start: Too many levels of symbolic links

【PostgreSQL】ROWNUMのように行番号(現在行)を取得するROW_NUMBER