文字コードに関するtpircsのブックマーク (2)
-
﹁プログラマのための文字コード技術入門﹂を読んで自分なりに理解した点をザックリとまとめてみる。 それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。 間違いなどあればコメントなど頂けるとありがたいです。 それぞれの文字コードはどう違うのか? 日本語の文字コードは大きく以下の2つに分けられる JIS X 0208 文字集合をベースにしたもの Unicode文字集合をベースにしたもの JIS X 0208 文字集合をベースにした文字コードには、EUC-JP, Shift_JIS, ISO-2022-JP がある。 Unicode文字集合をベースにした文字コードには、UTF-8, UTF-16 などがある。 上で挙げた﹁文字コード﹂とは正確には﹁エンコーディング︵文字符号化方式︶﹂の事を指す。 文字符号化方式 文字集合って? 読んでそのまんま”文字の種類の集まり”。﹁キャラ
-
質問1‥﹁①②﹂﹁ⅠⅡ﹂﹁㍉㌔﹂などが文字化けします 解答‥文字コードとしてシフトJIS︵Shift_JIS︶の代わりにWindows-31Jを指定しましょう Windows環境で標準的に用いられている文字コードは、正確にいうと﹁Shift_JIS﹂ではなく、Shift_JISを拡張した﹁Windows-31J﹂と呼ばれるWindows標準文字セットである。JavaではJDK 1.2以降で﹁MS932﹂という名称でサポートされており、JDK 1.4.1以降はWindows-31JというIANAの正式名称でも利用可能になっている。 このWindows-31Jは、以下のようなWindows固有の機種依存文字を含んでいるのが特徴だ。 一方、MacintoshなどWindows以外のOSにおける﹁Shift_JIS﹂は、Windows-31Jとは異なる文字集合をサポートしている。例えばWindow
-
1