【IT168技术文档】前段时间帮客户写个php的数据迁移程序,将原来用oracle做数据迁移到mysql来。本文将介绍一下在迁移过程用到的技术要领及一些注意事项。
为什么要迁移
首先从运营成本考虑,用mysql可以节约不少的费用。另一方面,mysql的稳定性及功能不断地提高与增强,基本上可以满足客户的需求,如支持多 节点部署,数据分区等。还有就是mysql使用方便,比oracle简单易用。故客户就要求将已有的oracel数据表与内容迁移到mysql来。
为什么要自己写脚本
迁移的表与数据都蛮多的,有几百张表。因此手工完成不太方便。也尝试了一些免费的迁移工具,如:MySQLMigrationTool等,发现转移的字段类型不太符合要求(可能是原来的oracle表设计得不太好),会导致数据不太完整,觉得不是太可靠,所以决定自己写迁移脚本放心一些,有不符合要 求的也可立即调整,所以就开始吧。
所用到的技术支持
1. php5
2. php oci8
3. mysql 5.1
获取schema所有表
用以下语句可以从oracle中获得schema中所有的表名
SELECT table_name FROM user_tables
然后可以遍历所有表向mysql进行表结构的创建与数据的迁移工作。
获取单个表的所有字段与类型
用以下语句可以从oracle中获得单个表的所有字段与类型
SELECT COLUMN_NAME, DATA_TYPE, DATA_LENGTH, NULLABLE, DATA_DEFAULT
FROM USER_TAB_COLUMNS
WHERE TABLE_NAME = UPPER('{$table_name}') ORDER BY column_id ASC
这样可以得知表字段的名称,类型,长度,是否允许为空,默认值。因为oracle与mysql的字段类型并不完全兼容,故需要建立字段类型的对应关系表。
Oracle | Mysql |
number(<11) | int |
number(>11) | bigint |
varchar | varchar |
varchar2(<255) | varchar |
varchar2(>255) | text |
clob | text |
date | date |
获取单个表的Primary Foreign Unique Key
用以下语句可以从oracle中获得单个表的Primary Foreign Unique Key
SELECT C.CONSTRAINT_NAME, C.CONSTRAINT_TYPE, C.R_CONSTRAINT_NAME, C.DELETE_RULE,
CC.COLUMN_NAME
FROM USER_CONSTRAINTS C, USER_CONS_COLUMNS CC
WHERE C.TABLE_NAME=upper('{$table_name}') AND C.CONSTRAINT_TYPE!='C'
AND C.CONSTRAINT_NAME=CC.CONSTRAINT_NAME AND C.OWNER=CC.OWNER AND C.TABLE_NAME=CC.TABLE_NAME
ORDER BY C.CONSTRAINT_TYPE, C.CONSTRAINT_NAME, CC.POSITION
CONSTRAINT_TYPE 为 'P'则取得表的所有Primary Key ;为 'U'则取得表的所有Unique Key ;为 'R'则取得表的所有Foreign Key ;
获取单个表的索引
用以下语句可以从oracle中获得单个表的索引
SELECT T.INDEX_NAME,T.COLUMN_NAME,I.INDEX_TYPE
FROM USER_IND_COLUMNS T,USER_INDEXES I
WHERE T.INDEX_NAME = I.INDEX_NAME AND T.TABLE_NAME = I.TABLE_NAME AND T.TABLE_NAME = UPPER('{$table_name}')
这样可以获知表的索引名称,被索引的字段。
将所有的表信息组装成mysql的表结构
有了表名,字段信息,主键,Foreign, Unique.索引等信息,就可以将表结构建立起来。由于oracle没有自增字段,一个变通的方法是用primary key做为mysql中的自增字段,因为在oracle中没办法准确地知道哪个字段用到了seq来做自增,用这种方法也不是很准确。
获取schema所有views
用以下语句可以从oracle中获取schema所有views
SELECT VIEW_NAME,TEXT
FROM USER_VIEWS
这样可以获得view的名称及建立view的构成语句。
oracle与mysql不兼容的view处理
oracle的对view的构建语句比较宽松一些,mysql中对view的构建语句要严格些,from不能从子查询中构建,也就是人样的让语句是不被允许的
CREATE VIEW `view_name` AS SELECT * FROM (SELECT * FROM table_name) ...
那么处理这样的view,有一个办法是将子查询再建立成一个view,将子查询替换成新建立的view名即可。
迁移数据
数据的迁移,从oracle数据库中select出数据,拼装成mysql的insert语句就可以了。需要注意的两点:一是oracle的日期类 型的数据格式与mysql的日期类型格式不太一致,所以要用TO_CHAR(field_name, 'YYYY-MM-DD')将其转换成mysql的相应的数据格式;二是oracle中的clob字段的内容要用 oci_fetch_array($stid, OCI_ASSOC|OCI_RETURN_NULLS|OCI_RETURN_LOBS)将其取出,插入到mysql的text字段。 在mysql插入大量数据时,还要注意,在window的my.ini或my.cnf默认max_allowed_packet是1M要将其改为
[mysqld] ...
max_allowed_packet = 16M ...
要不会出现mysql goes away的错误,linux版本没有这个问题,因为其默认值就是16M。
不能迁移的内容
oracle 中的触发器、存储过程与mysql中是不一样的,所以不能通过脚本程序自动迁移过去。要手工进行重写。
总结
从oracle向mysql数据迁移,table结构与数据是基本上可以平移过去的,view有些还不是完全兼容oracle的语句,所以要对其作出一些中间表。触发器与存储过程是不能平移的,这两部份需要重写。表结构平移过去后,看是否都比较合适,如果觉得不太好还可以通过alter等语句对其进 行相应的调整。在导入大量数据时还要注意一下mysql的配置文件(my.ini或my.cnf)里的max_allowed_packet值,这应设置 得太小,以免导入数据时出错或导不进去或乱码等不稳定因素。