2011年2月22日星期二

几个在Unicode与GB码中不同的字

几个在UnicodeGB码中不同的字

这篇文章从下面几个字开始,你能看出它们有什么区别吗?

和㤘

和㧏

和㧟

和䏝

和钁

这几个字的奥妙是这样的:

右边的这几个字属于UTF字符集,但在GB字符集中没有对应物。

左边的这几个字同时存在于GBUTF字符集,但是绝大部分UTF字体均不单独设计这几个字的字形。

当使用只支持GB的字体时,左边的字一般可以显示,但右边的字大多不能显示。比如:Word中的隶书、华文仿宋、华文宋体。在Word中由于字体中不含此字,右边一列就会被改为默认的宋体。

当使用支持Unicode的字体,这几个字并不一定能正常显示!这是十分糟糕的事情。比如,Arial Unicode MS可以显示右边的一列,但会将左边一列字改为空白。而微软雅黑、微软正黑这样就是为了支持所有中文字符而设计的字体,虽然可以显示左边的字,但却没有新造字形,而是使用的宋体字形。

(这里区分三个现象:显示为空格,说明字体中有这个字,但是字体厂商没有设计此字的字形而以空格代替;字体被Word替换为宋体,说明字体中没有这个字,word以默认字体代替;字体名称仍然为原字体名称但字形变为宋体,说明厂商偷懒用宋体的字形代替了对应字的字形)

简单地说,这几个字不仅在UTF中有两个对应字,且默认对应字与GB中的字不同!

目前唯一可以同时较好地显示这两排字的,只有宋体。

一个基本完整的列表(现代汉语词典中涉及到的字,我尽量找了,也许不全)如下:

㑇㖞㘎㤘㧏㧟㧐㭎㱮㳠䁖䅟䌷䏝䓖䙌䞍钹䦃䦆䦷䦶䲟䲠䲢䴓䴔䴕䴖䴗䴘䴙䶮

钹

 

这些字有一个共同特点,就是,有对应的繁体字存在。