技术开发 频道

数据仓库杂谈


对于数据抽取,给几点建议
    一,必须先构建数据平台,对于一个长期的数据仓库项目,必须构建完整的数据平台,这个中转在前期可能要花费些时间,但对于后期是很有必要的,我想以数据为驱动相对业务驱动来说,实践更容易快捷。

    二,在项目未开始阶段,公司必须有足够的技术积累,最大程度地不让技术成为一个开发及实施的拌脚石,选择自己熟练的技术出发,若客户的硬性规定,那在开发的前期尽最大努力掌握它吧。

税务数据仓库实施简易步骤:最后,项目的运行实践
    数据仓库的开发不同于一般的业务系统开发,特别是测试验收,开发环境和生产环境对于数据仓库项目来说可能存大很大的区别,数据仓库的运行是一个不断向前的 过程,数据仓库的初始化及增量是密不可分的,但其中的测试远比任何业务系统难,原因有,抽取时间一般过长、网络因素、数据抽取失败的预防及处理,容错性等 这些都必须考虑,而且,数据仓库程序的发布也可能是多方面的,(可能有存储过程,etl工具mapping程序的迁移),应尽可能的把程序发布作为一统一 过程(过多的步骤出差的概率自然会高),程序版本的控制等。

    看到这里,我在此十分感谢,浪费了您很多宝贵时间,上面我可能提出了很多数据仓库中出现的问题,而没有讨论它的解决之道,我想,任何问题解决方法不可能是 绝对的,在此也希望大家共同探讨,数据仓库难在哪里,主要是数据仓库是要收拾别人的摊子。摊子实在是太烂的话,我想,再牛的人也不可能上出好的数据仓库项 目。
BTW:数据仓库之路多的是教训,吾将上下而求索…
0
相关文章