文字コード

出典: フリー百科事典『ウィキペディア(Wikipedia)』

: character code

[]


使

[]


187051876使5Baudot Code

19637ASCII: American Standard Code for Information Interchange ASA1964IBMSystem/360EBCDIC4BCD8

Unicode[編集]


Unicode[1]4

 ACR

[2]

CCS

[3][4]Unicode[5]

CEF



CES

8

gzip7Base64uuencodeBinHexQuoted-printable

[]




ruby 1.9StringCodeSet Independent, CSI使[6]



MIME: charsetcharacter set

[7]MIME

IANA



Unicode4: character map; CM[8]



IBM



XMLencoding

[]




Unicode6,400+131,072PUAPrivate Use Area=Windows-31JMicrosoft Windows Codepage 9321,880WindowsCP932Mac

JISJIS X 0208EUC-JPShift_JIS194EUC-JPShift_JIS94948,836194JIS X 02081997JIS X 0208:1997Shift_JISEUC-JP使JIS X 0213:200094942使4Shift_JIS-200494

[]

1[]


1

US-ASCIIASCII [ANSI INCITS 4] 

ISO/IEC 646
ISO646-JP

ISO/IEC 8859ISO/IEC 8859-1  ISO/IEC 8859-16
ISO-8859-1ISO/IEC 8859-1 

ISO-8859-5ISO/IEC 8859-5 

ISO-8859-6ISO/IEC 8859-6 

ISO-8859-7ISO/IEC 8859-7 

ISO-8859-11ISO/IEC 8859-11 

ISO-8859-15ISO/IEC 8859-15 

windows-1252Microsoft Windows Codepage 1252 

macintoshMacRoman 

KOI8-R

KOI8-U

TIS-620

EBCDIC

JIS X 0201JIS 

2[]


2

JIS X 0208 - 

JIS X 0212

JIS X 0213JIS X 0208 JIS X 0213:2004JIS2004

GB 2312 - 

GB 18030 - 

KPS 9566 - 使

KS X 1001KS C 5601 - 使

Big5 - 

CNS 11643 - 

[]


ISO/IEC 2022ISO/IEC 2022
ISO-2022-JPRFC 1468JISJIS X 0208
ISO-2022-JP-1RFC 2237JIS X 0208JIS X 0212

ISO-2022-JP-2RFC 1554JIS X 0208JIS X 0212GB 2312KS X 1001ISO/IEC 8859-1ISO/IEC 8859-7

ISO-2022-JP-3JIS X 0213:2000

ISO-2022-JP-2004JIS X 0213:2004

ISO-2022-CNRFC 1922GB 2312CNS 11643
ISO-2022-CN-EXTRFC 1922GB 2312ISO-IR-165CNS 11643

ISO-2022-KRRFC 1557KS X 1001

EUC UNIX EUC8ISO/IEC 20228
EUC-JPJIS X 0208 
EUC-JISX0213JIS X 0213:2000

EUC-JIS-2004JIS X 0213:2004

EUC-KRRFC 1557KS X 1001

GB2312EUC-CNGB 2312
GBKMicrosoft Windows Codepage 936

GB18030GB 18030

EUC-TWCNS 11643

8
Shift_JISJIS X 0208
Shift_JISX0213JIS X 0213:2000

Shift_JIS-2004JIS X 0213:2004

Windows-31JMicrosoft932

x-Mac-JapaneseMacJapanese

7
HZ-GB-2312RFC 1842RFC 1843GB 2312

[]

ISO/IEC 10646Unicode[]


Unicode

ISO/IEC 10646UCSJIS X 0221ISO/IEC 10646-1ISO/IEC 10646-2ISO/IEC 10646:2003JIS X 0221-1JIS X 0221:2007JIS X 0221JIS X 0221 JA

Unicode []


UTF-8

UTF-16 
UTF-16

UTF-16BE

UTF-16LE

Compatibility Encoding Scheme for UTF-16: 8-BitCESU

UTF-32 
UTF-32

UTF-32BE

UTF-32LE

UTF-7

UTF-EBCDIC

Standard Compression Scheme for UnicodeSCSU

Binary Ordered Compression for UnicodeBOCU-1

[]




Adobe-Japan1
Adobe-Japan1-0

Adobe-Japan1-1JIS X 0208-1990MacJapanese

Adobe-Japan1-2IBM

Adobe-Japan1-3OpenType Std

Adobe-Japan1-4OpenType Pro

Adobe-Japan1-5OpenType Pr5JIS X 0213

Adobe-Japan1-6OpenType Pr6JIS X 0212U-PRESS

Adobe-Japan1-7

Adobe-Japan2
Adobe-Japan2-0Adobe-Japan1-6

Adobe-GB1
Adobe-GB1-0

Adobe-GB1-1

Adobe-GB1-2

Adobe-GB1-3

Adobe-GB1-4

Adobe-GB1-5

Adobe-CNS1
Adobe-CNS1-0

Adobe-CNS1-1

Adobe-CNS1-2

Adobe-CNS1-3

Adobe-CNS1-4

Adobe-CNS1-5

Adobe-CNS1-6

Adobe-CNS1-7

Adobe-Korea1
Adobe-Korea1-0

Adobe-Korea1-1

Adobe-Korea1-2Adobe-KR9

Adobe-KR
Adobe-KR9


SKSK72SK78ABC
Adobe-Japan1

PMT
貿


CO-59

CO-77

K-JIS

U-PRESS



BBeB 


100

JIS X 0208[9]

[]



ベンダー 文字コード 特徴
マイクロソフト cp932 マイクロソフト版Shift_JIS
マイクロソフト cp10001 マイクロソフト版MacJapanese
マイクロソフト cp20290 マイクロソフト版IBM CCSID 00290。
マイクロソフト cp20932 マイクロソフト版日本語EUC。
マイクロソフト cp21027 マイクロソフト版IBM CCSID 01027。
マイクロソフト cp50220 マイクロソフト版ISO-2022-JPの一つ。
マイクロソフト cp50221 マイクロソフト版ISO-2022-JPの一つ。
マイクロソフト cp50222 マイクロソフト版ISO-2022-JPの一つ。
マイクロソフト cp51932 Windows-31JをEUC-JPで表したもの。
サン・マイクロシステムズ cp942C cp942の拡張。
サン・マイクロシステムズ cp943C cp943の拡張。
Apple MacJapanese Apple版Shift_JIS
富士通 JEFジェフ メインフレーム(Mシリーズ、GSシリーズ)で利用される。JIS C 6226-1978をGR(Graphic Right)に展開し、その上方エリアに「JEF拡張漢字」というベンダ選定拡張漢字を配置。
富士通 EUC-U90 DS/90系UNIXサーバで利用される。JIS X 0208-1990をGRに展開し、「JEF拡張漢字」をシングルシフトのGR展開で表現。
日本電気 JIPS(J)ジップスジェー ACOS-6メインフレームで利用される。JIS C 6226-1978の9区〜13区に特殊文字を登録し、GR領域に「G1集合」というベンダ選定拡張漢字を登録したコード。
日本電気 JIPS(E)ジップスイー ACOS-2ACOS-4メインフレームで利用される。JIPS(J)の上下1バイトをそれぞれEBCDICに変換して得られるコード。
日本電気 NEC内部コード(E) ITOSA-VX系のオフコンで利用される。JIPS(J)の上1バイトをシフトさせたものに対して上下1バイトをそれぞれEBCDICに変換して得られるコード。
日立製作所 KEIS(78)ケイスナナハチ メインフレーム(Mシリーズ、APシリーズ)で利用される。JIS C 6226-1978をGRに展開し、その上方エリアに「拡張文字セット3」というベンダ選定拡張漢字を配置。
日立製作所 KEIS(83)ケイスハチサン メインフレーム(Mシリーズ、APシリーズ)で利用される。JIS X 0208-1983をGRに展開し、その上方エリアに「拡張文字セット3」というベンダ選定拡張漢字を配置。
日本IBM IBM漢字DBCS-Host メインフレームシステム/360系)、AS/400オフコン(現行製品ではIBM i搭載のPowerSystem)で利用される。JIS C 6226-1978以前に制定されたため、完全に独自の漢字表を使用。漢字部分については、Windows-31Jの第一・第二水準漢字およびIBM拡張文字との間で一対一の対応がある。
日本IBM cp930 メインフレームで利用される。
日本IBM cp932 IBM OS/2で利用される。マイクロソフトのcp932との同一性は未確認。
日本IBM cp939 メインフレームで利用される。
日本IBM cp942 IBM OS/2で利用される。
日本IBM cp943 IBM OS/2で利用される。
日本ユニシス LETS-Jレッツジェー ユニバックメインフレームで利用される。JIS X 0208-1983をGRに展開し、その上方および左方エリアにベンダ選定拡張漢字を配置。
日本ユニシス JBISジェイビス バロース系のコンピュータで利用される。
三菱電機 JSIIジェイエスツー
MELCOM漢字
三菱電機のメインフレームで利用される。JIS X 0208-1983をGRに展開し、その上方エリアにベンダ選定拡張漢字を配置。
DEC DEC 漢字 ミニコンVAX用OSであるVMSで利用される。JIS X 0208-1983をGRに展開し、その左方エリアにベンダ選定拡張漢字を配置。
DEC Super DEC 漢字 ミニコンVAX用OSであるVMSで利用される。JIS X 0208-1983をGRに展開し、その左方エリアにベンダ選定拡張漢字を配置。そして、シングルシフトのGR展開でJIS X 0212を表現。
アドビ 90ms-RKSJ-H アドビ版cp932 横書き用。
アドビ 90ms-RKSJ-V アドビ版cp932 縦書き用。
アドビ 90msp-RKSJ-H アドビ版cp932 半角英字プロポーショナル版横書き用。
アドビ 90msp-RKSJ-V アドビ版cp932 半角英字プロポーショナル版縦書き用。
アドビ 83pv-RKSJ-H アドビ版漢字Talk6拡張版Shift_JIS 横書き用。
アドビ 90pv-RKSJ-H アドビ版MacJapanese 横書き用。
アドビ Add-RKSJ-H アドビ版富士通FMR拡張版Shift_JIS 横書き用。
アドビ Add-RKSJ-V アドビ版富士通FMR拡張版Shift_JIS 縦書き用。
アドビ Ext-RKSJ-H アドビ版NEC拡張版Shift_JIS 横書き用。
アドビ Ext-RKSJ-V アドビ版NEC拡張版Shift_JIS 縦書き用。

[]


 - 使
 - 

TRON - 


 - 使

 - 使

 - 使

MJMJ - IPA

 - 使


ARIB - ARIB STD-B24


 - 

JTB - JTBTRIPS使[10]

 - 

[]

[]

[]



(一)^ UTR#17: Unicode Character Encoding Model (English).  The Unicode Consortium (20081111). 2019521

(二)^ The Unicode Standard Version 12.0 (PDF) (English).  The Unicode Consortium. p. 90 (201957). 2019523 An abstract character does not necessarily correspond to what a user thinks of as a character and should not be confused with a grapheme.

(三)^ The Unicode Standard Version 12.0 (PDF) (English).  The Unicode Consortium. p. 29 (201957). 2019521 The range of integers used to code the abstract characters is called the codespace. A particular integer in this set is called a code point. When an abstract character is mapped orassigned to a particular code point in the codespace, it is then referred to as an encodedcharacter.

(四)^ The Unicode Standard Version 12.0 (PDF) (English).  The Unicode Consortium. p. 29 (201957). 2019521 an abstract character may be represented by a sequence of two (or more) other encoded characters.

(五)^ The Unicode Standard Version 12.0 (PDF) (English).  The Unicode Consortium. p. 30 (201957). 2019521 Not all assigned code points represent abstract character.

(六)^ http://docs.oracle.com/cd/E19455-01/806-5582/6jej6u9sp/index.html

(七)^ Freed and Postel. , 1.3. Charset, p.1.

(八)^ UTR#17: Unicode Character Encoding Model (English).  The Unicode Consortium (20081111). 2019720 a mapping from sequences of members of an abstract character repertoire to serialized sequences of bytes bridging all four levels in a single operation

(九)^ JIS X 02081999.2-3

(十)^ JTB - IT Part8(2009.6 IT Leaders ())

[]


19999ISBN 4-501-53060-X

199910ISBN 4-87233-486-8

bit2001420014ISBN 4-320-12038-8

20023ISBN 4-320-12040-X

Ken Lunde CJKV200212ISBN 4-87311-108-0

20062ISBN 4-320-12102-3

[]







[]


IANA  (IANA Character Set Registry) IANA 







RFC 2130: The Report of the IAB Character Set Workshop held 29 February 1 MarchIAB

Character Data Representation ArchitectureIBM(CDRA) IBM

Character Model for the World Wide Web 1.0: FundamentalsW3CWWW

Encoding Standard
Encoding Standard