符集。ASCII虽然仍是电脑运作的基础。但是毕竟太少。跟不上电脑应用发展的脚步。Unicode更强大。前面的255
Unicode
符可以映射ASCII
符表。
际标准组织于1984年4月成立ISO/IEC JTC1/SC2/WG2工作组。针对各

、符号进行统一性编码。1991年美
跨
公司成立Unicode Consortium。并于1991年10月与WG2达成协议。采用同一编码
集。目前Unicode是采用16位编码体系。其
符集内容与ISO10646的BMP(Basic Multilingual Plane)相同。Unicode于1992年6月通过DIS(Draf International Standard)。目前版本V2.0于1996公布。内容包含符号6811
。汉
20902
。韩
拼音11172
。造
区6400
。保留20249
。共计65534
。
际互联网的迅速发展。要求进行数据交换的需求越来越大。不同的编码体系越来越成为信息交换的障碍。而且多种语言共存的
档不断增多。单靠代码页已很难解决这些问题。于是UNICODE应运而生。
。
UNICODE是对
际标准ISO/IEC10646编码的一种称谓(ISO/IEC10646是一
际标准。亦称大
符集。它是ISO于1993年颁布的一项重要
际标准。其宗旨是全球所有
种统一编码)。另外它又是由美
的HP、Microsoft、IBM、Apple等大企业组成的联盟集团的名称。成立该集团的宗旨就是要推进多
种的统一编码。
节的全编码。对于ASCII
符它也使用两
节表示。代码页是通过高
节的取值范围来确定是ASCII
符。还是汉
的高
节。如果发生数据损坏。某处内容破坏。则会引起其后汉
的混乱。UNICODE则一律使用两
节表示一
符。最明显的好处是它简化了汉
的处理过程。
平面分为256行。256列。相对于两
节编码的高低两
节。
平面。称为Basic Multilingual Plane(基本多
种平面)。简称BMP。由于BMP仅用两
节表示。所以倍受青睐。
16位的编码来为超过65000
符提供映射。但这还不够。它不能覆盖全部历史上的
。也不能解决传输的问题(implantation head-ache's)。尤其在那些基于网络的应用中。因此。Unicode用一些基本的保留
符制定了三套编码方式。它们分别是UTF-8,UTF-16和UTF-32。正如名
所示。在UTF-8中。
符是以8位序列来编码的。用一
或几
节来表示一
符。这种方式的最大好处。是UTF-8保留了ASCII
符的编码做为它的一部分。例如。在UTF-8和ASCII中。"A"的编码都是0x41.UTF-16和UTF-32分别是Unicode的16位和32位编码方式。考虑到最初的目的。通常说的Unicode就是指UTF-16。
信息交换标准代码(American Standard Code for Information Interchange,简称ASCII码)来表示
符。这些
符可以是
母。数
。标点符号和控制符。用这种编码来表示英
在内的
符不成问题的。但要表示其它语言
如。阿拉伯
。中
。日
。维
。哈
...必须进行扩充。在1987年。Xerox Palo Alto研究中心的Joe Becker和Lee Collins。以及Apple公司的Mark Davis试图研究一种适用于多
种处理的
符编码。这种编码很快就得到了许多大公司的支持。这些公司都派代表参加Unicode研究组。Unicode的研究得到了较快的进展。由于Unicode集团的成员都是世界上的主要系统及软件制造商。所以Unicode很快就成为事实上的工业标准。
不同的
符。足以善盖世界所有语言的所有
母。外加数千种符号。
。包括ASCII,Latin1,Greek,Cyrillic,Armenian,Hedrew,Arabic,Devanagari,Bengali ,Gurmukhi,Gujarati,Oriya,Tamil,Telugu,Kannada,Malayalam,Thai,Lao,Tibetan,Georgian等语言
之外。还包括汉语。日语和朝鲜语中的所有大量
符。
种
符集编码。它试图善盖现有的有关
家和地区的标准。包括GB2312,CNS11643,JIS 0208和KSC 5601等。Unicode可以表示混合
资料。也可以保证以前的ISO 10646。
Unicode字符可以映射ASCII字符表。
。1991年美国跨国公司成立Unicode Consortium。并于1991年10月与WG2达成协议。采用同一编
字集。目前Unicode是采用16位编

。其字符集内容与ISO10646的BMP(Basic Multilingual Plane)相同。Unicode于1992年6月通过DIS(Draf International Standard)。目前版本V2.0于1996公布。内容包含符号6811
。汉字20902
。韩文拼音11172
。造字区6400
。保留20249
。共计65534
。
的需求越来越大。不同的编

越来越成为信

的障碍。而且多种语言共存的文档不断增多。单靠代
页已很难解决这些问题。于是UNICODE应运而生。
的一种称谓(ISO/IEC10646是一
国际标准。亦称大字符集。它是ISO于1993年颁布的一项重要国际标准。其宗旨是全球所有文种统一编
)。另外它又是由美国的HP、Microsoft、IBM、Apple等大企业组成的联盟集团的名称。成立该集团的宗旨就是要推进多文种的统一编
。
页最显著不同点在于:UNICODE是两字节的全编
。对于ASCII字符它也使用两字节表示。代
页是通过高字节的取值范围来确定是ASCII字符。还是汉字的高字节。如果发生数据损坏。某处内容破坏。则会引起其后汉字的混乱。UNICODE则一律使用两
字节表示一
字符。最明显的好处是它简化了汉字的处理过程。
空间。每
平面分为256行。256列。相对于两字节编
的高低两
字节。
平面。称为Basic Multilingual Plane(基本多文种平面)。简称BMP。由于BMP仅用两
字节表示。所以倍受青睐。
16位的编
来为超过65000字符提供映射。但这还不够。它不能覆盖全部历史上的文字。也不能解决传输的问题(implantation head-ache's)。尤其在那些基于网络的应用中。因此。Unicode用一些基本的保留字符制定了三套编
方式。它们分别是UTF-8,UTF-16和UTF-32。正如名字所示。在UTF-8中。字符是以8位序列来编
的。用一
或几
字节来表示一
字符。这种方式的最大好处。是UTF-8保留了ASCII字符的编
做为它的一部分。例如。在UTF-8和ASCII中。"A"的编
都是0x41.UTF-16和UTF-32分别是Unicode的16位和32位编
方式。考虑到最初的目的。通常说的Unicode就是指UTF-16。

标准代
(American Standard Code for Information Interchange,简称ASCII
)来表示字符。这些字符可以是字母。数字。标点符号和控制符。用这种编
来表示英文在内的字符不成问题的。但要表示其它语言文字如。阿拉伯文。中文。日文。维文。哈文...必须进行扩充。在1987年。Xerox Palo Alto研究中心的Joe Becker和Lee Collins。以及Apple公司的Mark Davis试图研究一种适用于多文种处理的字符编
。这种编
很快就得到了许多大公司的支持。这些公司都派代表参加Unicode研究组。Unicode的研究得到了较快的进展。由于Unicode集团的成员都是世界上的主要
统及软件制造商。所以Unicode很快就成为事实上的工业标准。
统允许使用65000
不同的字符。足以善盖世界所有语言的所有字母。外加数千种符号。
。它试图善盖现有的有关国家和地区的标准。包括GB2312,CNS11643,JIS 0208和KSC 5601等。Unicode可以表示混合文字资料。也可以保证以前的ISO 10646。
统不支持Unicode。
集。ASCII虽然仍是电脑运作的基础。但是毕竟太少。跟不上电脑应用发展的脚步。Unicode更强大。前面的255
Unicode字
可以映射ASCII字
表。

行统一性编码。1991年美国跨国公司成立Unicode Consortium。并于1991年10月与WG2达成协议。采用同一编码字集。目前Unicode是采用16位编码体系。其字
集内容与ISO10646的BMP(Basic Multilingual Plane)相同。Unicode于1992年6月通过DIS(Draf International Standard)。目前版本V2.0于1996公布。内容包

6811
。汉字20902
。韩文拼音11172
。造字区6400
。保留20249
。共计65534
。
行数据交换的需求越来越大。不同的编码体系越来越成为信息交换的障碍。而且多种语言共存的文档不断增多。单靠代码页已很难解决这些问题。于是UNICODE应运而生。

义。首先UNICODE是对国际标准ISO/IEC10646编码的一种称谓(ISO/IEC10646是一
国际标准。亦称大字
集。它是ISO于1993年颁布的一项
要国际标准。其宗旨是全球所有文种统一编码)。另外它又是由美国的HP、Microsoft、IBM、Apple等大企业组成的联盟集团的名称。成立该集团的宗旨就是要推
多文种的统一编码。
它也使用两字节表示。代码页是通过高字节的取值范围来确定是ASCII字
。还是汉字的高字节。如果发生数据损坏。某处内容破坏。则会引起其后汉字的混乱。UNICODE则一律使用两
字节表示一
字
。最明显的好处是它简化了汉字的处理过程。
平面分为256行。256列。相对于两字节编码的高低两
字节。
平面。称为Basic Multilingual Plane(基本多文种平面)。简称BMP。由于BMP仅用两
字节表示。所以倍受青睐。
16位的编码来为超过65000字
提供映射。但这还不够。它不能覆盖全部历史上的文字。也不能解决传输的问题(implantation head-ache's)。尤其在那些基于网络的应用中。因此。Unicode用一些基本的保留字
制定了三套编码方式。它们分别是UTF-8,UTF-16和UTF-32。正如名字所示。在UTF-8中。字
是以8位序列来编码的。用一
或几
字节来表示一
字
。这种方式的最大好处。是UTF-8保留了ASCII字
的编码做为它的一部分。例如。在UTF-8和ASCII中。"A"的编码都是0x41.UTF-16和UTF-32分别是Unicode的16位和32位编码方式。考虑到最初的目的。通常说的Unicode就是指UTF-16。
。这些字
可以是字母。数字。标点
和控制
。用这种编码来表示英文在内的字
不成问题的。但要表示其它语言文字如。阿拉伯文。中文。日文。维文。哈文...必须
行扩充。在1987年。Xerox Palo Alto研究中心的Joe Becker和Lee Collins。以及Apple公司的Mark Davis试图研究一种适用于多文种处理的字
编码。这种编码很快就得到了许多大公司的支持。这些公司都派代表参加Unicode研究组。Unicode的研究得到了较快的
展。由于Unicode集团的成员都是世界上的主要系统及软件制造商。所以Unicode很快就成为事实上的工业标准。
不同的字
。足以善盖世界所有语言的所有字母。外加数千种
。
。
集编码。它试图善盖现有的有关国家和地区的标准。包括GB2312,CNS11643,JIS 0208和KSC 5601等。Unicode可以表示混合文字资料。也可以保证以前的ISO 10646。
Unicode字符可以映射ASCII字符表。
立ISO/IEC JTC1/SC2/WG2工作组。针对各国文字、符号进行统一性编码。1991年美国跨国公司
立Unicode Consortium。并于1991年10月
WG2
协议。采用同一编码字集。目前Unicode是采用16位编码体系。其字符集内容
ISO10646的BMP(Basic Multilingual Plane)相同。Unicode于1992年6月通过DIS(Draf International Standard)。目前版本V2.0于1996公布。内容包含符号6811
。汉字20902
。韩文拼音11172
。造字区6400
。保留20249
。共计65534
。
为信息交换的障碍。而且
种语言共存的文档不断增
。
代码页已很难解决这些问题。于是UNICODE应运而生。
国际标准。亦称大字符集。它是ISO于1993年颁布的一项重要国际标准。其宗旨是全球所有文种统一编码)。另外它又是由美国的HP、Microsoft、IBM、Apple等大企业组
的联盟集团的名称。
立该集团的宗旨就是要推进
文种的统一编码。
字节表示一
字符。最明显的好处是它简化了汉字的处理过程。
平面分为256行。256列。相对于两字节编码的高低两
字节。
平面。称为Basic Multilingual Plane(基本
文种平面)。简称BMP。由于BMP仅用两
字节表示。所以倍受青睐。
16位的编码来为超过65000字符提供映射。但这还不够。它不能覆盖全部历史上的文字。也不能解决传输的问题(implantation head-ache's)。尤其在那些基于网络的应用中。因此。Unicode用一些基本的保留字符制定了三套编码方式。它们分别是UTF-8,UTF-16和UTF-32。正如名字所示。在UTF-8中。字符是以8位序列来编码的。用一
或几
字节来表示一
字符。这种方式的最大好处。是UTF-8保留了ASCII字符的编码做为它的一部分。例如。在UTF-8和ASCII中。"A"的编码都是0x41.UTF-16和UTF-32分别是Unicode的16位和32位编码方式。考虑到最初的目的。通常说的Unicode就是指UTF-16。
年来。计算机普遍采用美国信息交换标准代码(American Standard Code for Information Interchange,简称ASCII码)来表示字符。这些字符可以是字母。数字。标点符号和控制符。用这种编码来表示英文在内的字符不
问题的。但要表示其它语言文字如。阿拉伯文。中文。日文。维文。哈文...必须进行扩充。在1987年。Xerox Palo Alto研究中心的Joe Becker和Lee Collins。以及Apple公司的Mark Davis试图研究一种适用于
文种处理的字符编码。这种编码很快就得到了许
大公司的支持。这些公司都派代表参加Unicode研究组。Unicode的研究得到了较快的进展。由于Unicode集团的
员都是世界上的主要系统及软件制造商。所以Unicode很快就
为事实上的工业标准。
不同的字符。足以善盖世界所有语言的所有字母。外加数千种符号。
独收录了19种语言文字。包括ASCII,Latin1,Greek,Cyrillic,Armenian,Hedrew,Arabic,Devanagari,Bengali ,Gurmukhi,Gujarati,Oriya,Tamil,Telugu,Kannada,Malayalam,Thai,Lao,Tibetan,Georgian等语言文字之外。还包括汉语。日语和朝鲜语中的所有大量字符。
文种字符集编码。它试图善盖现有的有关国家和地区的标准。包括GB2312,CNS11643,JIS 0208和KSC 5601等。Unicode可以表示混合文字资料。也可以保证以前的ISO 10646。
Unicode字符可以映射ASCII字符表。
统一性编码。1991年美国跨国公司成立Unicode Consortium。并于1991年10月与WG2达成协议。采用同一编码字集。目前Unicode是采用16位编码体系。其字符集
与ISO10646的BMP(Basic Multilingual Plane)相同。Unicode于1992年6月通过DIS(Draf International Standard)。目前版本V2.0于1996公布。

含符号6811
。汉字20902
。韩文拼音11172
。造字区6400
。保留20249
。共计65534
。

交换的需求越来越大。不同的编码体系越来越成为信息交换的障碍。而且多种语言共存的文档不断增多。单靠代码页已很难解决这些问题。于是UNICODE应运而生。
国际标准。亦称大字符集。它是ISO于1993年颁布的一项重要国际标准。其宗旨是全球所有文种统一编码)。另外它又是由美国的HP、Microsoft、IBM、Apple等大企业组成的联盟集团的名称。成立该集团的宗旨就是要推进多文种的统一编码。
的代码页最显著不同点在于:UNICODE是两字节的全编码。对于ASCII字符它也使用两字节表示。代码页是通过高字节的取值范围来确定是ASCII字符。还是汉字的高字节。如果发生
损坏。某处
破坏。则会引起其后汉字的混乱。UNICODE则一律使用两
字节表示一
字符。最明显的好处是它简化了汉字的处理过程。
平面分为256
。256列。相对于两字节编码的高低两
字节。
平面。称为Basic Multilingual Plane(基本多文种平面)。简称BMP。由于BMP仅用两
字节表示。所以倍受青睐。
16位的编码来为超过65000字符提供映射。但这还不够。它不能覆盖全部历史上的文字。也不能解决传输的问题(implantation head-ache's)。尤其在那些基于网络的应用中。因此。Unicode用一些基本的保留字符制定了三套编码方式。它们分别是UTF-8,UTF-16和UTF-32。正如名字所示。在UTF-8中。字符是以8位序列来编码的。用一
或几
字节来表示一
字符。这种方式的最大好处。是UTF-8保留了ASCII字符的编码做为它的一部分。例如。在UTF-8和ASCII中。"A"的编码都是0x41.UTF-16和UTF-32分别是Unicode的16位和32位编码方式。考虑到最初的目的。通常说的Unicode就是指UTF-16。
字。标点符号和控制符。用这种编码来表示英文在
的字符不成问题的。但要表示其它语言文字如。阿拉伯文。中文。日文。维文。哈文...必须进
扩充。在1987年。Xerox Palo Alto研究中心的Joe Becker和Lee Collins。以及Apple公司的Mark Davis试图研究一种适用于多文种处理的字符编码。这种编码很快就得到了许多大公司的支持。这些公司都派代表参加Unicode研究组。Unicode的研究得到了较快的进展。由于Unicode集团的成员都是世界上的主要系统及软件制造商。所以Unicode很快就成为事实上的工业标准。
不同的字符。足以善盖世界所有语言的所有字母。外加
千种符号。
括ASCII,Latin1,Greek,Cyrillic,Armenian,Hedrew,Arabic,Devanagari,Bengali ,Gurmukhi,Gujarati,Oriya,Tamil,Telugu,Kannada,Malayalam,Thai,Lao,Tibetan,Georgian等语言文字之外。还
括汉语。日语和朝鲜语中的所有大量字符。
括GB2312,CNS11643,JIS 0208和KSC 5601等。Unicode可以表示混合文字资料。也可以保证以前的ISO 10646。

符集。ASCII虽然仍是电脑运作的基础。但是毕竟太少。跟不上电脑应用发展的脚步。Unicode更强
。前面的255
Unicode
符可以映射ASCII
符表。
组织于1984年4月成立ISO/IEC JTC1/SC2/WG2工作组。针对各国文
、符号进行统一性编码。1991年美国跨国公司成立Unicode Consortium。并于1991年10月与WG2达成协议。采用同一编码
集。目前Unicode是采用16位编码体系。其
符集内容与ISO10646的BMP(Basic Multilingual Plane)相同。Unicode于1992年6月通过DIS(Draf International Standard)。目前版本V2.0于1996公布。内容包含符号6811
。汉
20902
。韩文拼音11172
。造
区6400
。保留20249
。共计65534
。
。不同的编码体系越来越成为信息交换的障碍。而且多种语言共存的文档不断增多。单靠代码页已很难解决这些问题。于是UNICODE应运而生。
ISO/IEC10646编码的一种称谓(ISO/IEC10646是一
国际
。亦称
符集。它是ISO于1993年颁布的一项重要国际
。其宗旨是全球所有文种统一编码)。另外它又是由美国的HP、Microsoft、IBM、Apple

业组成的联盟集团的名称。成立该集团的宗旨就是要推进多文种的统一编码。
节的全编码。对于ASCII
符它也使用两
节表示。代码页是通过高
节的取值范围来确定是ASCII
符。还是汉
的高
节。如果发生数据损坏。某处内容破坏。则会引起其后汉
的混乱。UNICODE则一律使用两
节表示一
符。最明显的好处是它简化了汉
的处理过程。
平面分为256行。256列。相对于两
节编码的高低两
节。
平面。称为Basic Multilingual Plane(基本多文种平面)。简称BMP。由于BMP仅用两
节表示。所以倍受青睐。
。是用1
16位的编码来为超过65000
符提供映射。但这还不够。它不能覆盖全部历史上的文
。也不能解决传输的问题(implantation head-ache's)。尤其在那些基于网络的应用中。因此。Unicode用一些基本的保留
符制定了三套编码方式。它们分别是UTF-8,UTF-16和UTF-32。正如名
所示。在UTF-8中。
符是以8位序列来编码的。用一
或几
节来表示一
符。这种方式的最
好处。是UTF-8保留了ASCII
符的编码做为它的一部分。例如。在UTF-8和ASCII中。"A"的编码都是0x41.UTF-16和UTF-32分别是Unicode的16位和32位编码方式。考虑到最初的目的。通常说的Unicode就是指UTF-16。
代码(American Standard Code for Information Interchange,简称ASCII码)来表示
符。这些
符可以是
母。数
。
点符号和控制符。用这种编码来表示英文在内的
符不成问题的。但要表示其它语言文
如。阿拉伯文。中文。日文。维文。哈文...必须进行扩充。在1987年。Xerox Palo Alto研究中心的Joe Becker和Lee Collins。以及Apple公司的Mark Davis试图研究一种适用于多文种处理的
符编码。这种编码很快就得到了许多
公司的支持。这些公司都派代表参加Unicode研究组。Unicode的研究得到了较快的进展。由于Unicode集团的成员都是世界上的主要系统及软件制造商。所以Unicode很快就成为事实上的工业
。
不同的
符。足以善盖世界所有语言的所有
母。外加数千种符号。
。包括ASCII,Latin1,Greek,Cyrillic,Armenian,Hedrew,Arabic,Devanagari,Bengali ,Gurmukhi,Gujarati,Oriya,Tamil,Telugu,Kannada,Malayalam,Thai,Lao,Tibetan,Georgian
语言文
之外。还包括汉语。日语和朝鲜语中的所有
量
符。
符集编码。它试图善盖现有的有关国家和地区的
。包括GB2312,CNS11643,JIS 0208和KSC 5601
。Unicode可以表示混合文
资料。也可以保证以前的ISO 10646。

用
标准字符集。ASCII虽然仍是电脑运作
基础。但是毕竟太少。跟不上电脑应用发展
脚步。Unicode更强大。前面
255
Unicode字符可以映射ASCII字符表。
立ISO/IEC JTC1/SC2/WG2工作组。针对各国文字、符号进行统一性编码。1991年美国跨国公司
立Unicode Consortium。并于1991年10月与WG2达
协议。采用同一编码字集。目前Unicode是采用16位编码体系。其字符集内容与ISO10646
BMP(Basic Multilingual Plane)相同。Unicode于1992年6月通过DIS(Draf International Standard)。目前版本V2.0于1996公布。内容包含符号6811
。汉字20902
。韩文拼音11172
。造字区6400
。保留20249
。共计65534
。
网
迅速发展。要求进行数据交换
需求越来越大。不同
编码体系越来越
为信息交换
障碍。而且多种语言共存
文档不断增多。单靠代码页已很难解决这些问题。于是UNICODE应运而生。
一种称谓(ISO/IEC10646是一
国际标准。亦称大字符集。它是ISO于1993年颁布
一项重要国际标准。其宗旨是全球所有文种统一编码)。另外它又是由美国
HP、Microsoft、IBM、Apple等大企业组

盟集团
名称。
立该集团
宗旨就是要推进多文种
统一编码。
代码页
显著不同点在于:UNICODE是两字节
全编码。对于ASCII字符它也使用两字节表示。代码页是通过高字节
取值范围来确定是ASCII字符。还是汉字
高字节。如果发生数据损坏。某处内容破坏。则会引起其
汉字
混乱。UNICODE则一律使用两
字节表示一
字符。
明显
好处是它简化了汉字
处理过程。
平面分为256行。256列。相对于两字节编码
高低两
字节。
第一
平面。称为Basic Multilingual Plane(基本多文种平面)。简称BMP。由于BMP仅用两
字节表示。所以倍受青睐。
初目标。是用1
16位
编码来为超过65000字符提供映射。但这还不够。它不能覆盖全部历史上
文字。也不能解决传输
问题(implantation head-ache's)。尤其在那些基于网络
应用中。因此。Unicode用一些基本
保留字符制定了三套编码方式。它们分别是UTF-8,UTF-16和UTF-32。正如名字所示。在UTF-8中。字符是以8位序列来编码
。用一
或几
字节来表示一
字符。这种方式
大好处。是UTF-8保留了ASCII字符
编码做为它
一部分。例如。在UTF-8和ASCII中。"A"
编码都是0x41.UTF-16和UTF-32分别是Unicode
16位和32位编码方式。考虑到
初
目
。通
说
Unicode就是指UTF-16。
字符不
问题
。但要表示其它语言文字如。阿拉伯文。中文。日文。维文。哈文...必须进行扩充。在1987年。Xerox Palo Alto研究中心
Joe Becker和Lee Collins。以及Apple公司
Mark Davis试图研究一种适用于多文种处理
字符编码。这种编码很快就得到了许多大公司
支持。这些公司都派代表参加Unicode研究组。Unicode
研究得到了较快
进展。由于Unicode集团
员都是世界上
主要系统及软件制造商。所以Unicode很快就
为事实上
工业标准。
系统允许使用65000
不同
字符。足以善盖世界所有语言
所有字母。外加数千种符号。
所有大量字符。
2B多文种字符集编码。它试图善盖现有
有关国家和地区
标准。包括GB2312,CNS11643,JIS 0208和KSC 5601等。Unicode可以表示混合文字资料。也可以保证以前
ISO 10646。
操作系统不支持Unicode。
的标准字符集。ASCII虽然仍
电脑运作的基础。但
毕竟太少。跟不上电脑应
发展的脚步。Unicode更强大。前面的255
Unicode字符可以映射ASCII字符表。
同一编码字集。目前Unicode

16位编码体系。其字符集内容与ISO10646的BMP(Basic Multilingual Plane)相同。Unicode于1992年6月通过DIS(Draf International Standard)。目前版本V2.0于1996公布。内容包含符号6811
。汉字20902
。韩文拼音11172
。造字区6400
。保留20249
。共计65534
。
。
多种语言共存的文档不断增多。单靠代码页已很难解决这些问题。于
UNICODE应运
生。
对国际标准ISO/IEC10646编码的一种称谓(ISO/IEC10646
一
国际标准。亦称大字符集。它
ISO于1993年颁布的一项重要国际标准。其宗旨
全球所有文种统一编码)。另外它又
由美国的HP、Microsoft、IBM、Apple等大企业组成的联盟集团的名称。成立该集团的宗旨就
要推进多文种的统一编码。
两字节的全编码。对于ASCII字符它也使
两字节表示。代码页
通过高字节的取值范围来确定
ASCII字符。还
汉字的高字节。如果发生数据损坏。某处内容破坏。则会引起其后汉字的混乱。UNICODE则一律使
两
字节表示一
字符。最明显的好处
它简化了汉字的处理过程。
平面来描述编码空间。每
平面分为256行。256列。相对于两字节编码的高低两
字节。
平面。称为Basic Multilingual Plane(基本多文种平面)。简称BMP。由于BMP仅
两
字节表示。所以倍受青睐。
1
16位的编码来为超过65000字符提供映射。但这还不够。它不能覆盖全部历史上的文字。也不能解决传输的问题(implantation head-ache's)。尤其在那些基于网络的应
中。因此。Unicode
一些基本的保留字符制定了三套编码方式。它们分别
UTF-8,UTF-16和UTF-32。正如名字所示。在UTF-8中。字符
以8位序列来编码的。
一
或几
字节来表示一
字符。这种方式的最大好处。
UTF-8保留了ASCII字符的编码做为它的一部分。例如。在UTF-8和ASCII中。"A"的编码都
0x41.UTF-16和UTF-32分别
Unicode的16位和32位编码方式。考虑到最初的目的。通常说的Unicode就
指UTF-16。
美国信息交换标准代码(American Standard Code for Information Interchange,简称ASCII码)来表示字符。这些字符可以
字母。数字。标点符号和控制符。
这种编码来表示英文在内的字符不成问题的。但要表示其它语言文字如。阿拉伯文。中文。日文。维文。哈文...必须进行扩充。在1987年。Xerox Palo Alto研究中心的Joe Becker和Lee Collins。以及Apple公司的Mark Davis试图研究一种适
于多文种处理的字符编码。这种编码很快就得到了许多大公司的支持。这些公司都派代表参加Unicode研究组。Unicode的研究得到了较快的进展。由于Unicode集团的成员都
世界上的主要系统及软件制造商。所以Unicode很快就成为事实上的工业标准。
65000
不同的字符。足以善盖世界所有语言的所有字母。外加数千种符号。
一种定长的2B多文种字符集编码。它试图善盖现有的有关国家和地区的标准。包括GB2312,CNS11643,JIS 0208和KSC 5601等。Unicode可以表示混合文字资料。也可以保证以前的ISO 10646。
Unicode字符可以映射ASCII字符表。
WG2达成协议。采用同一编码字集。目前Unicode是采用16位编码体
。其字符集

ISO10646的BMP(Basic Multilingual Plane)相同。Unicode于1992年6月通过DIS(Draf International Standard)。目前版本V2.0于1996公布。
包含符号6811
。汉字20902
。韩文拼音11172
。造字区6400
。保留20249
。共计65534
。

大。不同的编码体


成为信息交换的障碍。而且多种语言共存的文档不断增多。单靠代码页已很难解决这些问题。于是UNICODE应运而生。
国际标准。亦称大字符集。它是ISO于1993年颁布的一项重要国际标准。其宗旨是全球所有文种统一编码)。另外它又是由美国的HP、Microsoft、IBM、Apple等大企业组成的联盟集团的名称。成立该集团的宗旨就是要推进多文种的统一编码。
确定是ASCII字符。还是汉字的高字节。如果发生数据损坏。某处
破坏。则会引起其后汉字的混乱。UNICODE则一律使用两
字节表示一
字符。最明显的好处是它简化了汉字的处理过程。
描述编码空间。每
平面分为256行。256列。相对于两字节编码的高低两
字节。
平面。称为Basic Multilingual Plane(基本多文种平面)。简称BMP。由于BMP仅用两
字节表示。所以倍受青睐。
16位的编码
为超过65000字符提供映射。但这还不够。它不能覆盖全部历史上的文字。也不能解决传输的问题(implantation head-ache's)。尤其在那些基于网络的应用中。因此。Unicode用一些基本的保留字符制定了三套编码方式。它们分别是UTF-8,UTF-16和UTF-32。正如名字所示。在UTF-8中。字符是以8位序列
编码的。用一
或几
字节
表示一
字符。这种方式的最大好处。是UTF-8保留了ASCII字符的编码做为它的一部分。例如。在UTF-8和ASCII中。"A"的编码都是0x41.UTF-16和UTF-32分别是Unicode的16位和32位编码方式。考虑到最初的目的。通常说的Unicode就是指UTF-16。
。计算机普遍采用美国信息交换标准代码(American Standard Code for Information Interchange,简称ASCII码)
表示字符。这些字符可以是字母。数字。标点符号和控制符。用这种编码
表示英文在
的字符不成问题的。但要表示其它语言文字如。阿拉伯文。中文。日文。维文。哈文...必须进行扩充。在1987年。Xerox Palo Alto研究中心的Joe Becker和Lee Collins。以及Apple公司的Mark Davis试图研究一种适用于多文种处理的字符编码。这种编码很快就得到了许多大公司的支持。这些公司都派代表参加Unicode研究组。Unicode的研究得到了较快的进展。由于Unicode集团的成员都是世界上的主要
统及软件制造商。所以Unicode很快就成为事实上的工业标准。
统允许使用65000
不同的字符。足以善盖世界所有语言的所有字母。外加数千种符号。
统不支持Unicode。