技术开发 频道

Oracle数据库字符集浅析

【IT168技术文档】

  作为dba,在维护一个应用系统时,也许会遇到这样的问题,用户会抱怨在通过界面查询数据库中的数据时,显示出来的却是乱码,于是怀疑存储的数据成了乱码。特别是数据库中存放了简,繁2种字体的字符时,更容易出现这种问题,本文主要讨论数据库在存储简,繁体字符时出现的各种问题。

  ? 什么是数据库字符集(database characterset)?

  数据库字符集通常可以理解为数据库提供的存储某种语言字符的一种环境.举个例子:英文,法文等文字每个字符占一个字节,而汉字一个字符需要2个字节,这就要求数据库提供相应的存储环境来存储这些字符.

  ? 字符集在数据库中的应用。

  数据库在创建时是需要指定字符集的,它决定了以后数据库中所允许存放的语言字符,所以在系统设计当中,应当充分考虑数据库中可能存放的语言文字。在我们周围最常见的数据库字符集的问题就是存储,显示简体,繁体字符的问题.

  ? 和汉字相关的字符集

  目前存放汉字的数据库最常用的两种字符集是ZHS16CGB231280和ZHS16GBK .前者只包含了大约7000多个汉字,很多生僻字和繁体字都没有包含进来.而ZHS16GBK是前者的一个扩展,大约包含了2.1万个汉字字符,基本上包括了所有的繁体字和生僻字.而这两种字符集又是大多数存储中文数据库中选用的字符集。

0
相关文章