Group:文字情報基盤-登記固有文字 (Ratio of glyphs implemented: 100% [27 glyphs implemented, 0 glyphs pending])
From GlyphWiki, the free glyph database
登記固有文字(10,162字)
- 『平成20年度 汎用電子情報交換環境整備プログラム成果報告書』(汎用電子2008)の対象漢字は,戸籍統一文字55,267字,住基統一文字19,432字,戸籍統一文字にない登記固有文字は10,330字でした。
漢字データベースプロジェクトにある,汎用電子2008以降の情報を更新した以下のファイル(以下では「汎用電子データ」と呼びます)では,戸籍統一文字1字が削除,戸籍統一文字3字が追加,登記固有文字が167字削除されています。
- MJ文字情報一覧表Ver.004.01では,さらに住基統一文字131字が追加,戸籍統一文字が1字追加されていますが,これらは汎用電子データには反映されていません。追加された戸籍統一文字は登記固有文字だったので,登記固有文字が1字削除されます。
この結果,文字情報一覧表にある変更をすべて反映した登記固有文字は10,162字になります。このうち1,111字は,住基統一文字と同定されて文字情報基盤の対象になっています。文字情報基盤の対象外の登記固有文字(以下では「その他の登記固有文字」と呼びます)は,9,051字になります。
文字情報一覧表と汎用電子データの相違点
- 文字情報一覧表と汎用電子データを対照させる場合は,両者のデータが違う部分について整合性をとる調整が必要な場合があります。
戸籍統一番号の扱い
- 登記統一文字01078030が戸籍統一文字552710になったことが汎用電子データに反映されていません。
文字情報基盤は戸籍統一番号と登記統一番号の2つの情報をもち,登記固有文字が戸籍統一文字になった場合,登記統一番号の方は以前のままです。汎用電子データは戸籍統一文字は戸籍統一文字番号,登記固有文字は登記統一番号の情報をもちます。登記統一文字が戸籍統一文字になったことを汎用電子データに反映させるには,登記統一文字番号を戸籍統一文字番号に変更する必要があります。
「平成明朝体グリフ名」の対応
- 汎用電子データと文字情報一覧表の平成明朝体グリフ名は以下のように,戸籍統一文字で1字,住基統一文字で9字,登記固有文字で7字ずれています。
- 1と2は,『平成23年度 汎用電子情報交換環境整備プログラム フォローアップ成果報告書 附属資料3』でJTC0BFからJTB494に変更されたことが,汎用電子データに反映されていません。
4と5は,平成明朝KS112430にバグがあり,文字情報基盤が戸籍統一文字112430と対応しないと判断しました。
6から11は,追加された住基統一文字と同定された登記固有文字に対応する平成明朝体グリフ名が汎用電子データにあって,文字情報一覧表にありません。
IVSの対応
- IVDと漢字データベースプロジェクトのそれぞれに,Hanyo-DenshiコレクションのIVSと平成明朝体グリフ名の対応関係を示すファイルがあります。
- IVDと汎用電子データは,IVSによって13,044字の対応をつけることができます。その他に汎用電子に含まれないJA4076u7dcb-ue0102がIVDにあって,汎用電子データにありません。ただし,このIVSは,MJ020228としてMoji_Johoコレクションに含まれ,文字情報一覧表にあります。
汎用電子データと文字情報一覧表は,平成明朝グリフ名によって対応をつけることができます。登記固有文字のみが対応する平成明朝体グリフ名は文字情報一覧表にありませんが,その他にJB1908u51de-ue0105が汎用電子データにあって,文字情報一覧表にありません。
JB1908は汎用電子に含まれない字形ですが,直井靖さんが解説 する通り,JIS X0212の字形であることから,特例としてHanyo-Denshiコレクションに含まれました。
文字情報一覧表の平成明朝体グリフ名の対応関係を汎用電子データのそれにそろえると,両者に存在する13,043字のIVSと平成明朝体グリフ名の対応関係を一致させることができます。しかし,これらとIVDでは771字で対応する平成明朝体グリフ名が違っています。このため,IVDと文字情報一覧表を直接対照すると,典拠する漢字をたどることが困難になります。