關(guān)于Unicode
由于各國國家標(biāo)準(zhǔn)字集所收的漢字字?jǐn)?shù)、常用字的差異,雖然象中國兩岸GB/BIG5字集常用字基本類似,轉(zhuǎn)換后閱讀并不成問題,但是這種編碼轉(zhuǎn)換的混亂關(guān)系,對文字交流始終是一種障礙。因此相關(guān)國家的標(biāo)準(zhǔn)化組織和文字工作者經(jīng)過共同努力,終于在93年完成了包含中日韓(CJK)漢字的Unicode 漢字標(biāo)準(zhǔn)ISO 10646.1。 Unicode是完全雙字節(jié)表示的多國文字編碼體系,編碼空間0x0000-0xFFFF。 ISO 10646.1漢字標(biāo)準(zhǔn)使用編碼0x4E00-9FA5,共包含20902個漢字。其中: 大陸(S)提出的漢字17124個,臺灣(T)提出的漢字17258個; S與T的并集,即中國(C)提出的漢字為20158個。 日本(J)提出的漢字為12157個,中國未提出的690個(Ja); 韓國(K)提出的漢字為7477個,其中中國未提出的90個(Ka); Ja與Ka并集共744字。 支持Unicode編碼的相關(guān)電腦系統(tǒng)軟件,如Unix, Win95已有推出,但是由于Unicode的ASCII碼是用雙字節(jié)編碼(即一般電腦系統(tǒng)中的單字節(jié)ASCII碼前加 0x00),同時其漢字編碼與各國的現(xiàn)有編碼也不兼容,造成現(xiàn)有的軟件和數(shù)據(jù)不能直接使用,所以目前完全使用Unicode軟件系統(tǒng)的用戶并不多,大多數(shù)只將它此作為一個國際語言編碼標(biāo)準(zhǔn)來使用。