如何建立DB2分区数据库?
分区键
分区键 是一列(或一组列),用于确定将某行数据存储在什么分区。分区键是使用 CREATE TABLE 语句在表上定义的。如果没有为分布在数据库分区组中的多个数据库分区中的表空间中的表定义分区键,在缺省情况下将会根据主键的第一列创建分区键。若未指定主键,则缺省分区键是在该表中定义的第一个非长型字段列。( 长型 包括所有长型数据类型和所有大对象(LOB)数据类型)。若没有列满足缺省分区键的要求,则不会不带键创建该表。
好的表分区键就是将数据均匀分布在数据库分区组中的所有数据库分区上的分区键。不适当的分区键会导致数据分发不均匀。数据分发不均匀的列和含有少数特异值的列不应选作分区键。特异值的数目必须足够大,才能确保将行均匀分布在数据库分区组中的所有数据库分区上。应用分区散列算法的成本与分区键的大小是成正比的。分区键不能超过 16 列,而且列越少,性能越好。不应将不需要的列包括在分区键中。
当定义分区键时,应该考虑下列几点:
• 不支持创建只包含长型数据类型(LONG VARCHAR、LONG VARGRAPHIC、BLOB、CLOB 或 DBCLOB)的多分区表。
• 不能改变分区键定义。
• 分区键应该包括最频繁连接的列。
• 分区键应该由经常参与 GROUP BY 子句的列组成。
• 任何唯一键或主键必须包含所有分区键列。
• 在联机事务处理(OLTP)环境中,分区键中的所有列都应该使用带常量或主机变量的等于(=)谓词来参与该事务。例如,假
定有一个在事务中经常使用的职员号 emp_no,如:
• UPDATE emp_table SET ... WHERE
emp_no = host-variable
散列分区 是确定分区表中每一行的位置的方法。该方法的原理如下:
1. 将散列算法应用于分区键的值,并生成介于 0 与 4095 之间的分区号。
2. 创建数据库分区组时将创建分区映射。每个分区号依次以循环方式重复,以填写该分区映射。
3. 该分区号用作分区映射中的一个索引。分区映射中该位置处的编号是存储该行的数据库分区的编号。
在分区数据库中跨越几个分区创建一个表在性能上有几个优点。与检索数据相关联的工作可分成几部分在各个数据库分区中进行。
必须小心地选择适当的分区键,因为 以后再也不能更改它 。再者,必须将任何唯一索引(因此也是唯一键或主键)定义为分区键的一个超集。即,若定义了分区键,则唯一键和主键必须包括所有与分区键相同的列(它们可能有多列)。
表的一个分区大小不能超过 64 GB 和可用的磁盘空间中较小的那一个。(假设表空间具有 4 KB 的页大小。)该表的最大大小可以是 64 GB(或可用磁盘空间)乘以数据库分区数之积。若该表空间的页大小为 8 KB,则该表最大的大小可以为 128 GB(或可用的磁盘空间)乘以数据库分区数之积。若该表空间的页大小为 16 KB,则该表的最大大小可为 256 GB(或可用的磁盘空间)乘以数据库分区数之积。若该表空间的页大小为 32 KB,则该表的最大大小可为 512 GB(或可用的磁盘空间)乘以数据库分区数之积。
以下是一个示例:
CREATE TABLE MIXREC (MIX_CNTL INTEGER NOT NULL,
MIX_DESC CHAR(20) NOT NULL,
MIX_CHR CHAR(9) NOT NULL,
MIX_INT INTEGER NOT NULL,
MIX_TMSTMP TIMESTAMP NOT NULL)
IN MIXTS12
PARTITIONING KEY (MIX_INT) USING HASHING
在上一个示例中,表空间是 MIXTS12,而分区键是 MIX_INT。若未显式指定分区键,则它是 MIX_CNTL。(若未指定主键且未定义分区键,则分区键是该列表中的第一个非长型字段的列。)
0
相关文章