GlyphWiki logo
navigation
help
search

toolbox
languages
groupdiscussionedit this pagehistory

Group:文字情報基盤-登記固有文字 (Ratio of glyphs implemented: 100% [27 glyphs implemented, 0 glyphs pending])

From GlyphWiki, the free glyph database

登記固有文字(10,162字)

  • 『平成20年度 汎用電子情報交換環境整備プログラム成果報告書』(汎用電子2008)の対象漢字は,戸籍統一文字55,267字,住基統一文字19,432字,戸籍統一文字にない登記固有文字は10,330字でした。
  • 漢字データベースプロジェクトにある,汎用電子2008以降の情報を更新した以下のファイル(以下では「汎用電子データ」と呼びます)では,戸籍統一文字1字が削除,戸籍統一文字3字が追加,登記固有文字が167字削除されています。
  • MJ文字情報一覧表Ver.004.01では,さらに住基統一文字131字が追加,戸籍統一文字が1字追加されていますが,これらは汎用電子データには反映されていません。追加された戸籍統一文字は登記固有文字だったので,登記固有文字が1字削除されます。
  • この結果,文字情報一覧表にある変更をすべて反映した登記固有文字は10,162字になります。このうち1,111字は,住基統一文字と同定されて文字情報基盤の対象になっています。文字情報基盤の対象外の登記固有文字(以下では「その他の登記固有文字」と呼びます)は,9,051字になります。

登記固有文字10 162
_文字情報基盤漢字1 111
_その他の登記固有文字9 051
__Unicodeに対応3 132
__Unicodeに対応していない5 919
___IRGN1637で提案予告された文字360Group:ziyang_sandbox@17
___IRGN1521で提案予告された文字627Group:ziyang_sandbox@18
___その他4 932

文字情報一覧表と汎用電子データの相違点

  • 文字情報一覧表と汎用電子データを対照させる場合は,両者のデータが違う部分について整合性をとる調整が必要な場合があります。

戸籍統一番号の扱い

  • 登記統一文字01078030が戸籍統一文字552710になったことが汎用電子データに反映されていません。
  • 文字情報基盤は戸籍統一番号と登記統一番号の2つの情報をもち,登記固有文字が戸籍統一文字になった場合,登記統一番号の方は以前のままです。汎用電子データは戸籍統一文字は戸籍統一文字番号,登記固有文字は登記統一番号の情報をもちます。登記統一文字が戸籍統一文字になったことを汎用電子データに反映させるには,登記統一文字番号を戸籍統一文字番号に変更する必要があります。

「平成明朝体グリフ名」の対応

  • 汎用電子データと文字情報一覧表の平成明朝体グリフ名は以下のように,戸籍統一文字で1字,住基統一文字で9字,登記固有文字で7字ずれています。

No.Hanyo-Denshi IVS汎用電子Moji_Joho IVS文字情報戸籍統一文字・登記固有文字住基統一文字
1u6f9a-ue0102JTC0BFu6f9a-ue0103JTB494juki-b494
2u6f9a-ue0102JTC0BFJTB494juki-c0bf
3u7b11-ue0102JTB7A3u7b11-ue0102TK01069460toki-01069460juki-b7a3
4u5f5a-ue0102KS112430koseki-112430
5u5f5a-ue0102KS112430
6TK01000920toki-01000920juki-c143
7TK01037980toki-01037980juki-c164
8TK01070610toki-01070610juki-c118
9TK01094380toki-01094380juki-c182
10TK01097920toki-01097920juki-c141
11u4e6d-ue0101TK01120320toki-01120320juki-c146

IVSの対応

  • IVDと漢字データベースプロジェクトのそれぞれに,Hanyo-DenshiコレクションのIVSと平成明朝体グリフ名の対応関係を示すファイルがあります。
  • IVDと汎用電子データは,IVSによって13,044字の対応をつけることができます。その他に汎用電子に含まれないJA4076u7dcb-ue0102がIVDにあって,汎用電子データにありません。ただし,このIVSは,MJ020228としてMoji_Johoコレクションに含まれ,文字情報一覧表にあります。
  • 汎用電子データと文字情報一覧表は,平成明朝グリフ名によって対応をつけることができます。登記固有文字のみが対応する平成明朝体グリフ名は文字情報一覧表にありませんが,その他にJB1908u51de-ue0105が汎用電子データにあって,文字情報一覧表にありません。
    JB1908は汎用電子に含まれない字形ですが,直井靖さんが解説 する通り,JIS X0212の字形であることから,特例としてHanyo-Denshiコレクションに含まれました。
    文字情報一覧表の平成明朝体グリフ名の対応関係を汎用電子データのそれにそろえると,両者に存在する13,043字のIVSと平成明朝体グリフ名の対応関係を一致させることができます。しかし,これらとIVDでは771字で対応する平成明朝体グリフ名が違っています。このため,IVDと文字情報一覧表を直接対照すると,典拠する漢字をたどることが困難になります。