Unicode エスケープシーケンス︵\uXXXX)形式 に変換するもの ついでにHTMLの数字文字参照、文字実体参照にも対応させてみた。 メモ Unicode の UTF-8 エンコーディングは ASCII 文字と互換性があります。 Unicode 文字の U+0020 から U+007E までは ASCII 文字の 0x20 から 0x7E と同等です。 ASCII はラテンアルファベットをサポートしており、7ビット文字セットを使用します。 UTF-8 は各文字について1オクテットから4オクテットを使用します。 ︵﹁オクテット﹂は1バイト、すなわち8ビット︶。 \uXXXX形式 は多分、java、javascriptで使用可能。 数値文字参照︵文字参照︶‥数値文字参照は、10進数もしくは16進数によって文書文字集合における該当文字を指定する方法 例‥ ﹁©