マルチバイト文字

1文字を複数バイトで表すことなど

マルチバイト文字(マルチバイトもじ)とは、コンピュータ上で

  • 1文字を複数バイトで表す体系(文字コード
  • 1文字のバイト数が可変であるような体系
  • そのような体系で表される文字

を指すが、文脈により意味合いが異なる。

文字集合におけるマルチバイト文字

編集

ISO 202211: single-byte character set949612: multibyte character set94×94296×96294×94×94394×94

122: double-byte character set

GB 2312

JIS X 0208 (JIS C 6226)

JIS X 0212

JIS X 0213

KS X 1001 (KS C 5601)

KPS 9566

CNS 11643

221EUC-JPJIS X 020112[?]Unicode 12

符号化方式におけるマルチバイト文字

編集

シングルバイト文字との対比

編集

11[1]12

 ASCII  ISO 646  80 - FF161

 character set IBMsingle-byte character setdouble-byte character set2multibyte character set


ワイド文字との対比

編集

Ccharwchar_tchar1111

2411ASCII24ASCII2

使使[?] Unicode 使 ASCII  ISO 646  Shift_JIS  EUC-JP UTF-8 

UnicodeUTF-16UTF-3216321Unicode

CC952

mblen

mbtowc

wctomb

mbstowcs

wcstombs

Microsoft Windows216UTF-16Windows APIAUnicodeW_UNICODE[1]UnicodeAPIWindows 9xWindows NTUTF-16使API使Microsoft Visual C++7.1 (2003) 8.0 (2005) UnicodeAPI

MultiByteToWideChar

WideCharToMultiByte

CharNextA

CharPrevA

AAPI

Unicode

編集

[?] ISO 10646UnicodeUTF-8UTF-16使

 ISO 10646 1=1811ASCIIISO 646 Unicode 

UTF-8 UTF-16  ASCII  UTF-16  UTF-32 使UTF-8 使 Shift_JIS 使

脚注

編集

注釈

編集
  1. ^ ISO 8859/1、Windowsコードページ1252、Macintosh Roman など

出典

編集
  1. ^ Unicode Programming Summary” (英語). Microsoft Docs. 2019年7月15日閲覧。

関連項目

編集