外字

特定の文字集合に含まれない文字

JISJIS X 0208JIS X 0213JIS X 0221()

外字の弊害

編集

文字コードによるテキストデータの流通という意味では、外字の使用は好ましくない。一つの文字コードが異なるシステム間で同じ文字イメージであることが保証されないためである。

文字情報基盤事業などの成果として外字を使用しなくてよいように異体字セレクタを利用したUnicode IVD/IVSで定義された文字への包括が推進されている。文字情報基盤事業では、日本政府の戸籍/住民票業務で必要となる文字を整理して包括させた結果として戸籍統一文字と住基統一文字をとりまとめ、それらをまとめて文字情報基盤として文字セットを定義した。この文字情報基盤の文字を中心としてUnicode IVD/IVSで扱えるように文字コードが定義されている。日本政府では、行政のIT化のために戸籍/住民票業務を中心とした公文書で使える異体字を文字情報基盤で定義したものに包括して限定していく方針である。 MicrosoftもWindowsでの外字のサポートを縮小し、Unicode IVD/IVSによる異体字の利用を推進している。

文字コードにおける外字

編集

日本語1バイト文字集合における外字

編集

PC98シリーズなどでは、JIS X 0201の文字以外に記号などが個別に定義されていた。これらは98文字などと呼ばれ、外字の一種である。

JIS X 0208における外字

編集

1979JIS X 0208使



Microsoft Windows

Shift_JIS0xF0000xFFFCJIS X 0221 (Unicode



JIS X 02081997

JIS X 0213における外字

編集

2000JIS X 0213Shift_JIS-2004Shift_JISX0213Shift_JIS330xF0000xFFFC使

JIS X 0221 (Unicode)における外字

編集

UnicodeU+E000U+F8FFU+F0000U+FFFFDU+100000U+10FFFD2

WindowsShift_JIS0xF0400xF9FCUnicodeU+E000U+E757Shift_JIS0xF07F

WindowsU+E758U+F8FFWindowsUnicode使

WindowsWingdingsUnicodeU+F020U+F0FF

FM使ARIB使Unicode
ユーザ外字領域(Shift_JIS) 私用領域(Unicode) 文字数
0xF040 - 0xF07E U+E000 - U+E03E 63文字
0xF080 - 0xF0FC U+E03F - U+E0BB 125文字
0xF140 - 0xF17E U+E0BC - U+E0FA 63文字
0xF180 - 0xF1FC U+E0FB - U+E177 125文字
0xF240 - 0xF27E U+E178 - U+E1B6 63文字
0xF280 - 0xF2FC U+E1B7 - U+E233 125文字
0xF340 - 0xF37E U+E234 - U+E272 63文字
0xF380 - 0xF3FC U+E273 - U+E2EF 125文字
0xF440 - 0xF47E U+E2F0 - U+E32E 63文字
0xF480 - 0xF4FC U+E32F - U+E3AB 125文字
0xF540 - 0xF57E U+E3AC - U+E3EA 63文字
0xF580 - 0xF5FC U+E3EB - U+E467 125文字
0xF640 - 0xF67E U+E468 - U+E4A6 63文字
0xF680 - 0xF6FC U+E4A7 - U+E523 125文字
0xF740 - 0xF77E U+E524 - U+E562 63文字
0xF780 - 0xF7FC U+E563 - U+E5DF 125文字
0xF840 - 0xF87E U+E5E0 - U+E61E 63文字
0xF880 - 0xF8FC U+E61F - U+E69B 125文字
0xF940 - 0xF97E U+E69C - U+E6DA 63文字
0xF980 - 0xF9FC U+E6DB - U+E757 125文字
対応なし U+E758 - U+F8FF 4,520文字
対応なし U+000F0000 - U+000FFFFD 65,534文字
対応なし U+00100000 - U+0010FFFD 65,534文字

DRCS外字

編集

DRCS使ARIBJIS X 0208ARIB使使ARIB使

外字登録

編集

ワープロ専用機ワープロソフトWindows などのオペレーティングシステムでは、ユーザが自分で外字(ユーザー定義外字)を登録できるようになっている。

常用漢字表外字

編集

常用漢字表に含まれない文字のことを表外字と呼ぶ。平成12年に表外漢字字体表国語審議会が発表し、常用漢字に含まれない漢字の字形のよりどころを規定した。

人名・地名用外字

編集

使使 () ISO20176Unicode 10.0201712ISO/IEC 10646:2017IPAmj

使Unicode使 (NotoUDDroid)

DynaFont  (DynaComware) (SOURCENEXT)1500/PRO ()Super ()

入管正字・入管外字

編集

UnicodeUnicode 10.0CJKF

UnicodeUnicodeU+E000  U+F8FF使  Unicode = e5d4e5d5e5d6e5d7

登記用外字

編集



8[1]

(6)008

018
使[2]

 :

著名な外字集合

編集

JIS X 0208使

ARIB

使Unicode



RIS506-1996Music Shift-JISCDDVD-Audio使

i

DoCoMoiUnicode

EZweb

KDDIEZweb

SoftBank

SoftBankJ-Phone







Biblos

K-JIS

U-PRESSU-PRESSU-PRESSK-JIS[3]

 (U-PRESS)

Adobe-Japan1-6Unicode



JIS Z8210 ()[4]3 ()[5]

Adobe-Japan1-6対応フォントで表示できる外字集合

編集

Unicode (結合文字を含む) 及びOpenType Feature Tagの組み合わせで表示できるが、正しく表示するためにAdobe-Japan1-6対応フォントが必要となる文字集合。

通産省外字/Apple外字
通産省主導の文字フォント開発普及センターがJIS X 0208外で必要な記号定めた外字集合であり[6]、Macintoshなどで使用されている。

過去の外字集合

編集

Unicode

IBM

IBMJIS X 0208(IBMIBM)Microsoft

NEC/98[7]

NECJIS X 0208(NECNECIBM)Microsoft

Microsoft

MicrosoftOSIBMNEC使JIS X 0221

JIS2004

JIS X 0203:2004JIS X 0208

その他の外字

編集
裁判所外字
裁判所で使われている外字[8]
エヌフォー外字集合[9]
漫画用外字
写研の写植記号に由来し、主に漫画で使われる外字。イワタアンチック体、GL-アンチックなどに搭載されている。

医学用

編集
  • Win 外字辞書セット 医学バージョン[10]
  • エヌフォー外字DXオプションパック医学用[11]
  • エヌフォー外字DXオプションパック歯科用[11]

関連項目

編集

出典

編集
  1. ^ LEGALブログ(リーガル社員のここだけの話): 「登記統一文字」とはなにか
  2. ^ 登記統一文字01009670を含む神社 | yasuokaの日記 | スラド
  3. ^ 拡張文字セット イワタ U-PRESS Ver.2.1 イワタ
  4. ^ 一般案内用図記号フォント 窓の杜 2005年12月19日
  5. ^ ダイナコムウェア、183種のピクトグラムを追加した外字対応フォントパッケージ「人名記号外字3」 MdN Corporation 2018年10月4日
  6. ^ Foreign System Fonts kotobank
  7. ^ 98外字 kotobank
  8. ^ 第4回:弁護士の使う文字をペン越しに……の巻 大日本タイポ組合
  9. ^ 『CJKV日中韓越情報処理』 P.584 ケン ランディ著 小松章/逆井克己訳 2002年12月
  10. ^ Win 外字辞書セット 医学バージョン
  11. ^ a b エヌフォー外字DX オプションパック

外部リンク

編集