GlyphWiki logo
navigation
help
search
toolbox
languages
articlediscussionedit this pagehistory

GlyphWiki:日本の行政用の統一文字コードについて

From GlyphWiki, the free glyph database

日本では、さまざまな行政用「統一文字コード」があります。このページは、その統一文字コードについて解説しています。

戸籍統一文字

戸籍統一文字は、法務省の戸籍システムで取り扱われている文字集合です。各文字には10進数6桁の戸籍統一文字番号が付与されます。UnicodeやJISコードで包摂される字形の違いも区別して、別の番号が与えられます(例:koseki-352760 vs. koseki-349920)。住基ネット統一文字との互換性はありません。

文字の情報は法務省の公式サイト で確認できます。

グリフウィキでの戸籍統一文字の命名はkoseki-######です。

グリフウィキの戸籍統一文字の一覧はGroup:CodeChart-戸籍統一文字を参考してください。

住基ネット統一文字

住基ネット統一文字は、住民基本台帳ネットワークで使われている文字集合です。

住基ネット統一文字の具体的な仕様は基本的に非公開ですので、一部の情報しか知られておりません。設計仕様は次のようです。

  • Unicodeに基づいている2バイトの文字コード (0000~FFFF)
    • JIS X 0213:2000のUCS欄を全て収録 (カッコ付きのUCS欄もそのまま収録)
      • カッコ付きのUCS欄は、JIS X 0213:2000の制定当時UCSでなかった文字の臨時UCS欄のことである
    • JIS X 0212-1990の漢字もUCSで収録
      • 0213の例示字形と0212の例示字形が異なると、0213の例示字形を優先し、0212の例示字形を拡張領域に収録
    • その他の漢字もUCSで収録
  • 住基コードの独自拡張領域
    • AA00~ABFF: JIS X 0213:2000のカッコ付きのUCS欄の文字 (例:「𡈽」はAABEに収録)
    • AC00~ACFF: 非漢字拡張
    • AD00~D7A3: 漢字拡張

JIS X 0213:2000とUnicodeをベースにしていますが、JISとUnicodeで扱えない文字はUnicodeのハングル領域(AC00~D7A3)にマッピングしています。各文字には16進数4桁のUnicodeコードポイントが付与されます。UnicodeやJISコードで包摂される字形の違いも区別して、別のコードポイントが与えられます(例:juki-b9d5 vs. juki-845b)。戸籍統一文字との互換性はありません。

文字情報基盤文字情報一覧表 にて漢字部分のみ公開されていますが、住基ネット統一文字のコード順ではありません。

グリフウィキでの住基ネット統一文字の命名はjuki-####です。

グリフウィキの住基ネット統一文字の一覧はGroup:統一文字コードを参考してください。

登記統一文字

登記統一文字は、戸籍統一文字を拡張した文字集合です。詳しい情報は非公開のため知られておりません。各文字には10進数8桁の登記統一文字番号が付与されます。住基ネット統一文字との互換性はありません。

情報は文字情報基盤文字情報一覧表 にて部分的に公開されていますが、戸籍統一文字および住基ネット統一文字に無い、登記統一文字独自の文字は公開されておりません。

グリフウィキでの登記統一文字の命名はtoki-########です。

toki-00######はkoseki-######と同一です。toki-01######は登記統一文字独自の文字(住基ネット統一文字との重複はあり)です。

グリフウィキの登記統一文字の一覧はGroup:登記統一文字の一覧を参考してください。