文字コード解説

UCS2文字セット(Unicode2.1)

000 100 200 300 400 500 600 700 800 900 A00 B00 C00 D00 E00 F00
U+0000 〜 (1) ASCII 0 (1) UTF-8で2バイト UTF-8で3バイト
U+0080 〜 (2) 1
2
(2) 記号・各国アルファベット
3
U+3400 〜 (3) 4 (3) CJK拡張A
U+4E00 〜 (4) 5
6
7
8
9
(4) CJK統合漢字
U+A000 〜 (5) A
B
C
(5) 音節文字
U+D800 〜 (6) D (6) サロゲートペア
U+E000 〜 (7) E (7) ユーザ定義文字
U+F900 〜 (8) F (8) 表字形・互換文字

UCS4文字セット(Unicode3.2)

U+0000 〜 U+FFFFplane 0基本多言語面 (UCS2)
U+10000 〜 U+1FFFFplane 1追加多言語面
U+20000 〜 U+2FFFFplane 2追加漢字面 (CJK拡張B〜D)
U+E0000 〜 U+EFFFFplane 14追加特殊用途面
U+F0000 〜 U+FFFFFplane 15ユーザ定義文字
U+100000 〜 U+10FFFFplane 16

JIS文字セット(Unicodeとの関係)

JIS X0201:1997 7ビット及び8ビットの
情報交換用符号化文字集合
ラテン文字 96字 UCS2 (1)
片仮名 64字 UCS2 (8)
JIS X0208:1997 7ビット及び8ビットの
2バイト
情報交換用符号化漢字集合
非漢字 524字 UCS2 (2)
第1水準
第2水準
2965字
3390字
UCS2 (4)
JIS X0212:1990 情報交換用漢字符号
補助漢字
補助漢字 266字 UCS2 (2)X0213重複 166字
5801字 UCS2 (4)X0213重複 2743字
JIS X0213:2012

コード表
7ビット及び8ビットの
2バイト
情報交換用符号化
拡張漢字集合
非漢字 659字 UCS2 (2)535字・結合文字 25字
UCS2 (8)98字・UCS (4) 1字
第3水準
第4水準
1259字
2436字
UCS2 (3)164字
UCS2 (4)3146字
UCS2 (8)82字
UCS4 (CJK拡張B)303字

Unicodeエンコーディング

 UCS2   (印:FEFF)
 UCS4   (印:0000 FEFF)
 UTF-8  (印:EF BB BF)
 UTF-16 (印:FEFF)
UCS UTF-8 UTF-16
U+0001 〜 U+007F 01-7F 00 01-7F
U+0080 〜 U+07FF C2-DF 80-BF 00
01-07
80-FF
00-FF
U+0800 〜 U+D7FF
U+E000 〜 U+FFFF
E0-EF 80-BF 80-BF 08-D7
E0-FF
00-FF
00-FF
U+10000 〜 U+10FFFF F0-F4 80-BF 80-BF 80-BF D8-DB 00-FF DC-DF 00-FF


JIS規格番号からJISを検索
http://www.jisc.go.jp/app/JPS/JPSO0020.html

 JIS X0208 
附属書1 (X0208_04) シフト符号化表現(ShiftJISの規定)
附属書3 (X0208_06) 図形文字符号表(コード表)
附属書6 (X0208_09) 漢字の分類及び配列
 非漢字(524文字)1〜8区
 第1水準(2965字)16〜47区(31区×94字+51字)
 第2水準(3390字)48〜84区(36区×94字+6字)

 JIS X0221 
附属書C 変換形式(UTF-16)
附属書D 変換形式(UTF-8)
附属書H UCSを識別するための”印”

 JIS X0212 
附属書1 特殊文字(21字)
附属書2 アルファベット(245字)
附属書3 漢字(5801字) 第16〜77区(61区×94字+67字)

 JIS X0213 
6.5.2 漢字集合中の図形文字の種類
種類X0208 X0213
a) 特殊文字 147 178 325
b) 数字 10 0 10
c) 数字に準じるもの 0 30 30
d) ラテン文字 52 0 52
e) 拡張ラテン文字 0 224 224
f) ひらがな 83 8 91
g) 片仮名 86 29 115
h) ギリシア文字 48 1 49
i) キリール文字 66 0 66
k) 囲み文字 0 131 131
l) けい線素片 32 15 47
m) 互換用文字 0 43 43
524659  1,183
 非漢字(1183字)1面1〜13区(13区×94字-39字[RSV])
 第1〜3水準(7614字)1面14〜94区(81区×94字)
 第4水準(2436字)2面1,3〜5,8,12〜15,78〜94区(25区×94字+86字)