February 12, 2014

中日韓兼容表意文字區

「中日韓兼容表意文字區」英文写做 CJK Compatibility Ideographs,范围是 U+F900 至 U+FAFF,见 Unicode 字符平面映射

按照维基百科英文版本「CJK Compatibility Ideographs」和日文版本「CJK互換漢字」中的描述可以推测,当时 Unicode 收录这些汉字的时候,有许多的重复汉字,最开始放入区块中的规格版本是「KS C 5601-1987」,这个是韩文的字符集,为了保证两个字符集间互相的兼容性,就将其放在了这个兼容区中。后来又将其他的兼容汉字也放入了这个区块中,比如台湾繁体、日文、北朝鲜汉字。再后来甚至是一少部分通常的、并非重复的汉字也放在了这个区块里。

举一个重复字的例子,比如 ,前边是韩文中的汉字(U+F979),后边是正常的中文(U+51C9)。后边的「凉」字并不在兼容区中,而是在「中日韓越統一表意文字」这个区块中。


blog comments powered by Disqus