漢字拆分查詢(IDS)

表意文字描述字符(英:Ideographic Description Character,IDC),是Unicode自 3.0 後對漢字所做的一種支援。

目前大部的編碼包含Unicode,對於漢字編碼的處理大致為先搜集漢字,給予每個漢字一個數字編碼。然而,漢字數量龐大,往往字集不完全。再加上漢字本身具有組合以及開放的特性,漢字使用者很有可能自造新字,因此不可能有一個字集可以搜集到所有漢字,所以用這樣的字符來描述某一個「字」是如何被更基本的部件組合起來。

Unicode定義了十二種組合字符:

碼號

字符

意義

例字

序列

例字

序列

2FF0

兩個部件由左至右組成

⿰木目

𠁢

⿰丨㇍

2FF1

兩個部件由上至下組成

⿱木口

𠚤

⿱𠂊丶

2FF2

三個部件由左至右組成

⿲彳氵亍

𠂗

⿲丿夕乚

2FF3

三個部件由上至下組成

⿳亠口小

𠋑

⿳亼目口

2FF4

兩個部件由外而內組成

⿴囗口

𠀬

⿴㐁人

2FF5

三面包圍,下方開口

⿵几皇

𧓉

⿵齊虫

2FF6

三面包圍,上方開口

⿶凵㐅

⿶乂丶

2FF7

三面包圍,右方開口

⿷匚斤

𧆬

⿷虎九

2FF8

兩面包圍,兩個部件由左上至右下組成

⿸疒丙

𤆯

⿸耂火

2FF9

兩面包圍,兩個部件由右上至左下組成

⿹戈廾

𢧌

⿹或壬

2FFA

兩面包圍,兩個部件由左下至右上組成

⿺走召

𥘶

⿺礼分

2FFB

兩個部件重疊

⿻工从

𣏃

⿻木⿻コ一