navigation
help
search
toolbox
languages
articlediscussionedit this pagehistory

GlyphWiki:命名ガイドライン

From GlyphWiki: the free glyph database

はじめに

グリフウィキでは、ユーザーが自由にグリフに名前をつけることを許容していますが、一部の名前については意味を持たせています。これらの命名ガイドラインに従ってください。

命名ガイドラインに沿ったものと紛らわしい名前のグリフについては、削除対象とすることがあります。

ISO/IEC 10646のコードポイントを指す命名ガイドライン

u####、u2####(#は16進数の0~9,a~f。CJK漢字が規定されているコードポイントに限る)は、ISO/IEC 10646のコードポイントに対応するグリフとしています。

字形のデザインは原則として規格票のJ欄(日本デザイン)を対象としています。厳密には国内規格で規定されている文字については国内規格最新版(JIS X 0213:2004)の収録字形となります。日本の規格に無いコードポイントの場合は、J欄およびK欄やT欄に近い字形が推奨されます。日本の規格にない文字ということは常用漢字外ですのでいわゆる旧字体のデザインとしてください。また諸橋轍次著『大漢和辞典』の掲載字体に沿うことも期待されます。

G欄のみのコードポイント(例えば簡体字)は、厳密には中国デザインであるほうが望ましく、日本デザインに見られる装飾的要素(例えば「ム」の1画目が2画分に見えるようなデザイン)はやめたいところですが、日本のグリフウィキは日本デザインのグリフの管理を目的としているため、いわゆるウソ字になりますが日本デザインのデータを登録してください。

偏化変形のための命名ガイドライン

例えば「金」という漢字部品は金偏になるとu91d1-01のように変形します。これをグリフウィキでは「偏化変形」と呼びます。あるUCSコードポイントの漢字に対して、偏化変形した部品のコードポイントが存在しない場合に、偏化変形部品用の接尾コードが用意されています。

接尾コード意味
-01左右結合の左、左中右結合の左、中
-02左右結合の右、左中右結合の右
-03上下結合の上、上中下結合の上、中
-04上下結合の下、上中下結合の下
-05囲い結合の外
-06囲い結合の中
-07位置の指定はないが単独字ではなく部品として利用
-08縦長部品として利用(-01、-02の共通部品に相当)
-09横長部品として利用(-03、-04の共通部品に相当)
-10囲い外部品で中の密度が通常より高いもの
-11囲い外部品で中の密度が通常より低いもの
-14上下結合の下、上中下結合の下で、三角屋根の形状のもの
-15-05以外の同じUCSコードポイントに対する囲い外部品

例えばu91d1-01の場合、元となる「金」はu91d1ですので、「u91d1-01」という命名が望まれています。ただし部品によっては「釒(u91d2)」のように部品自体に文字コードが用意されているケースもあります。この場合は、「釒(u91d2)」に対してデータを割り当て、さらに「釒(u91d2)」を部品に使って「u91d1-01」を用意することを推奨します。

また、多くの部品は、それ単独で文字となる場合のデザインと、部品として使用する場合のデザインが異なるケースがあります。これを実現するために、場所を指定しない部品には「-07」という接尾コードを推奨します。あるいは、縦長や横長に部品を使用した場合のバランスを調整しているグリフは「-08」「-09」をつけてください。

なお、部品として利用する際のデザイン変更が生じないものについてはあえて「-07」などのグリフを新設せずに、UCSコードポイントそのもののグリフをそのまま利用するようにしてください。

将来的には、漢字を部品とその相対的な位置関係で記述することにより、自動的にグリフをデザインする機能を実現します。その際、たとえば「偏」のように左側に位置する部品は「-01」→「-08」→「-07」→「なし」という優先順でデータを探索します。

このため、特異なケース(例えばu5962の「者」の1画目は上部品の兼ね合いで左右幅が短くなっています)の部品を登録するときに汎用的な命名となる「-07」などを利用しないでください。この場合は次項の「-##-var-###」を利用してください(「-07」が登録されていなくても)。

偏化変形グリフのバリエーションは後ろに「-var-###」をつけて3桁の数字を振ってください(例:u200a2-02u200a2-02-var-001u200a2-02-var-002)。

複数欄指定のための命名ガイドライン

UCSの複数欄表記に対応して、どの欄のグリフかを明示する場合は次の接尾コードを利用してください。URO領域以外の1欄表記の場合で原規格(ソース)における区別を行う場合も同様です。

接尾コード意味
gG欄・ソース
tT欄・ソース
jJ欄・ソース
jaJIS X 0213の字形が反映される前のJ欄(Ext.AのJAソース)
jsJIS X 0213の字形が反映される前のJ欄(補助漢字)
kK欄・ソース
kpKP欄・ソース(pより変更)
vV欄・ソース
mM欄・ソース
hHソース
myマレーシアソース
sgシンガポールソース
uUソース(ISO規格でUソースとなっているもの。もともと「The Unicode Standard の字形」としていましたが変更します)
usThe Unicode Standard の字形(現在は複数欄表記になっているため今後区別が必要になることは少ないと思われます)
iISO規格でExt.Bなどの一覧表記となっているもの

たとえばu9aa8u9aa8-gなどが区別できます。

UCSコード相当の名前のグリフに日本デザインではないグリフが登録されている場合

資料の見間違いなどにより、日本デザインではないグリフがUCSコード相当のグリフとして登録されている場合があります。この場合は、まずISO/IEC 10646:2003の規格票を見て、正しい字形を確認する必要があります。

規格票は以下のページにてPDF形式で公開されています。

http://std.dkuug.dk/jtc1/sc2/wg2/

正しい字形の確認、および現在登録されているグリフがどの地域デザインと同定できるかを確認した上で、グリフデータの移動と修正を行ってください。現在、データの移動機能はありませんので、元データの編集モードに入る→データをクリップボードにコピー→新しい名前で新規作成→クリップボードの内容を貼り付け、という作業を行う必要があります。

両者の組み合わせ

地域と偏化変形を組み合わせる場合は「-(地域)(偏化変形部位)」とします。たとえば「u725b-t01」のようになります。

それ以外の異体字

上記以外の任意の異体字は、対象となるUCSコードに接頭辞"-itaiji-"を加え、さらに任意の3桁の10進数の番号をつけて区別してください。例:u88e8-itaiji-001

異体字

異体字に相当するグリフについては「-itaiji-###」および「-var-###」の2種類がありますが、この区別は「ISO/IEC 10646でユニフィケーション対象となっている差異」に相当する場合は「-var-###」を、それ以外は「-itaiji-###」としてください。

AdobeJapan-1(CID)グリフ

アドビ社が定めている独自のグリフ集合であるAdobeJapan(PDF) 集合については、CID番号による表現と、Unicode標準のIVS を用いる方法の2種類がありますが、特に片方に統一せず以下の2通りのいずれかとしてください。

  • aj1-##### (# は10進数の数字) 例:aj1-07765
  • (ベースとなるUCSコード)-(IVSコード) 例:u90a3-ue0101

IDSによる記述

IDSを用いた記述も可能です。UCSコードを"-"記号で繋げてください(IDSについての参考 )。

例:u2ff0-u53e3-u6606 (⿰口昆)

IDSの記述に使う部品は素の符号位置としてください。「-02」「-g」などの情報はつけないでください。このことにより同じIDS記述で異なるグリフを登録したい場合は、当面「-itaiji」を利用してください。

 不可:u2ff0-u53e3-01-u6606-02
 可:u2ff0-u53e3-u6606
 可:u2ff0-u53e3-u6606-itaiji-001

ただし組み文字(㍻など)は、次項の組み文字記述を利用してください

第1面以降の文字はサロゲート分解しないでください。

組み文字の記述

組み文字はグリフ名の頭に「kumimoji-」をつけた上でIDSによる記述としてください。

例:kumimoji-u2ff1-u2ff0-u682a-u5f0f-u2ff0-u4f1a-u793e

その他の文字コード、字典番号など

以下の命名記述は暗黙的に予約されているので、対象となるグリフ以外のためには利用しないで下さい。なお、JIS規格票字形については下記のより下にあるものがUCSのJ欄であると仮定します。GL領域の番号とは、区および点番号にそれぞれ32(0x20)を足したものを16進数表記としたものです(例:53区21点は5535)。(参考:GlyphWiki:GL領域の番号とは

koseki-######戸籍統一文字番号。10進数6桁固定で頭の0は省略しません
gt-#####GTコード
gt-k#####GT-kコード
cdp-####CDP外字
cb#####CBETA
j78-####JIS X 0208:1978規格票例示字形。GL領域の番号で記述
j83-####JIS X 0208:1983規格票例示字形。GL領域の番号で記述
j90-####JIS X 0208:1990(1997も同等)規格票例示字形。GL領域の番号で記述
jsp-####JIS X 0212:1990規格票例示字形。GL領域の番号で記述
jx1-2000-####JIS X 0213:2000規格票第1面例示字形。GL領域の番号で記述
jx1-2004-####JIS X 0213:2004規格票第1面例示字形。GL領域の番号で記述(UCS符号位置の使用を推奨)
jx2-####JIS X 0213:2000(2004も同等)規格票第2面例示字形。GL領域の番号で記述(UCS符号位置の使用を推奨)
k0-####KS X 1001規格票例示字形
c1-####CNS 11643 Plane 1(以下234…15(cf-####)面も同じ)
b-####Big5コード
jc3-####JEF-CHINA3コード
dkw-#####諸橋轍次『大漢和辞典』番号。ダッシュ付きは末尾に「d」、2点ダッシュは「dd」を加える。補巻はdkw-h####とします。m-#####は使いません
kx-######康煕字典(同文書局影印本)字形。頭4桁はページ番号、下2桁はページ内番号
baseparts-#####...(廃止済み:詳細は次項)。JIS X 0208収録漢字の初期データを構成する基礎部品

「baseparts-*****」部品について

「baseparts-*****」部品群は廃止されました。原則として「baseparts-*****」グリフの編集や新規作成は行わないでください。

今昔文字鏡の文字番号の利用について

文字鏡研究会が配布している今昔文字鏡フォントで定義されている文字番号については、そのライセンス 上、グリフウィキでは利用するべきではないと解釈しています。ですので、別のソースをもとにした名前を付けてください。誤解を避けるため「mojikyo-」「m-」などの命名を行わないようにしてください。