2005年12月20日14:07 カテゴリiTechLogos追記: UTF-8 vs. ISO-10646 文字集合(Character Set)と符号化(Encoding)について、より適切な表現と追補すべきネタがあったのでEntry quinta essentia - Character Set vs. Encoding となって、U+7FFFFFFF まで許すという話もあって、ややこしさが増す。符号化(Encoding) は 文字集合(Character Set) の乗りものである こう言えば一目瞭然ですね。 UTF-8という﹁乗り物﹂には2^31個の座席があるが、17^2^16個の座席しか今では使わないことになっています。別の﹁乗り物﹂であるUTF-16にはそれしか座席が用意できないのがその理由です。 UTF-8とPerl 実は、Perlで扱う"utf8"というのは、ISO-1
![追記: UTF-8 vs. ISO-10646 : 404 Blog Not Found](https://cdn-ak-scissors.b.st-hatena.com/image/square/da78a05937633f7a2b4b2219826151c370cd607b/height=288;version=1;width=512/https%3A%2F%2Fparts.blog.livedoor.jp%2Fimg%2Fusr%2Fcmn%2Fogp_image%2Flivedoor.png)