Unicode は計17面、21ビットまで。UTF-8 は4バイトまで。 Kawa.netブログ(川崎有亮)/ウェブリブログ

UTF-8 の仕様を知ったとき、U+0080 以降では1バイト目が C0〜FF、2バイト目以降が 80〜BF の範囲内になっていて、EUC とかと違って文字の先頭バイトの位置が確認できる仕様は賢いと思った。 その頃の UCS-4 では、1文字31ビットで最大で128群×256面×65,536文字の収録が想定されていて(または32ビットだったかも…?)、それをUTF-8 で表すと1文字あたり最大6バ...続きはこちら