前言
无须吹捧,在过去十年Unicode已经完全改变了软件和通信的基础。无论你在电脑上读写什么,你都使用Unicode。无论你在Google, Yahoo!, MSN, Wikipedia或其它web站点中搜索,你都使用Unicode。
Unicode 5.0标志着一个里程碑,它提供任何地方的人们在电脑上使用自己的语言的能力。
Unicode开始于一个简单的目标:去统一无数种不同的字符编码方法,替换成一个简单的、全球统一标准。那些遗留下来的字符编码是不完整和不一致的:两种编码使用同样的内部编码表示不同的字符、使用不同的内部编码表示同样的字符、没有编码表示的一些小语种(?)。文本数据在不同程序和平台之间转换时,就会有讹误的危险。
过去程序通过“硬编码”去支持特别的编码,制作开发国际版本是昂贵的。对于公司和用户来说,产品投放在外国市场是高价和不令人满意的。发展中国家尤其困难,在支持小市场上行不通。他们被迫去使用特殊字体来代表任意字符。但是当字体无效时,内容将变得混乱。
Unicode从根本上改变这种状况。现在对于所有文本,程序只需要一个唯一的表达来支持全世界的语言。程序结构能够容易地从程序代码中分离出来,提供了多语言RAD(快速开发工具)的基础。
这样,多语言版本程序几乎能够同时开发,而只有一点增加的成本,甚至包括像Microsoft Office 或者OpenOffice这样的复杂程序。
字符指派只是Unicode标准和辅助说明的一小部分。他们为程序师提供了关于字符函数的广泛描述和巨量数据:怎样构成词和断行;怎样在不同语言中排序文本;怎样格式化不同语言中的数字、日期、时间和其它适当的元素;怎样去显示从右到左书写的语言如阿拉伯和希伯来文,或者像分隔、联合、重排书写的南亚语言;怎样处理全世界安全公司关于“外形相似”的字母表。没有unicode标准和辅助说明中的属性、算法和其它规范,不同工具之间的互通将是不可能的。
随着web的增长,文本的单一表达成为全球无缝通讯的绝对必需。HTML 和XML的文本内容由unicode定义,每个程序处理XML必须在内部使用unicode.搜索引擎全都使用unicode是个好的理由。甚至使用遗存字符的web页面,搜索引擎索引页面的唯一有效方式是转换它为通用语言Unicode。所有web中文本能够被同样的程序代码保存、搜索、匹配。由于所有搜索引擎转换web页面为Unicode,最可靠的方式中保存页面为Unicode。
本版本的Unicode 5.0取代和废弃了所有先前的标准版本。本书尺寸小,不昂贵,有数百页的新内容和修改。像人类的企业,Unicode当然不是没有瑕疵。本书有助于你unicode的工作,重要的是,它将帮助您了解哪些特点,可能在将来会改变,哪些不能,所以你可以适当地优化您的工具。如果你对unicode未来发展方向感兴趣,或者密切跟进这些正在进行的工作,你将从unicode协会找到信息。你手中所拥有的是来自全球的专家多年经验的精华,我确信你将发现它是非常有用的。
Mark Davis, Ph.D.
Unicode协会主席











Unicode 標準版本5.0(前言xxxi)
翻译:

夏子华 童生 | Blog
收藏,不错的消息
04/09/2008