毫无疑问,这是一个信息爆炸的时代。你的服务器上充满了各种各样的数据。问题就提出来了,你如何处理那些非结构化数据?在本文中,让“数据仓库之父” W.H. Inmon谈谈他自己的独到见解。
摘要:本文主要介绍使用kettle 来建立一个Type 2的Slowly Changing Dimension 以及其中一些细节问题
本文主要讨论使用Kettle来设计一些较为复杂和动态的转换可能使用到的一些技巧,这些技巧可能会让你在使用Kettle的时候更加容易的设计更强大的ETL任务。
在虚拟机镜像中部署服务器应用程序的做法风靡一时。当需求改变时,虚拟服务器可以快速地从一台机器移到另一台机器上的这种能力让IT部门受益无穷。但是,这种做法适用于像SQL Server这样的重量级系统吗?对于这个问题,Conor Cunningham提出了否定的看
这篇指南你需要建立并配置Oracle Warehouse Builder 11gR1环境.你也会使用Repository Assistant 去创建一个用户并登录到你的设计元数据储存的仓库
从索引策略、索引的分片以及快速载入与查询性能的等方面对表的设计进行阐述后后,接下的此篇将讲述怎么样优化数据仓库环境方面的知识。
本文论述了IBM关于数据仓库系统配置最佳实践BCU的概念和方法论,并给出了具体的配置方案,供我们在数据仓库规划或扩容时参考。
本教程中,你可以学到如下一些东西:下载和执行设置脚本来为后面的课程做准备. 创建OWB Design Center 用户和安装Repository ;登录到OWB Design Center 并打开一个OWB 项目.
在这篇文章中,将接着详细讲述一下表的设计相关的一些问题,将从索引策略、索引的分片以及快速载入与查询性能的等方面进行详细阐述。
本文主要讨论当架构一个很大的、高性能的数据仓库,特别是对那种无法预知有多少查询量的系统时要考虑的一些东西。这个讨论包括SQL Server 2005的一些新的特性以及在使用这些特性的时候需要考虑的一些东西。
本文就基于开源BI平台Openi的数据仓库系统,进行整体设计及开发,就其中比较热门的技术,如OLAP、数据仓库等进行初步的讲解,以期起到一个抛砖引玉的作用。
五一期间哪里都没有去,看了一段关于魔兽世界的视频,讲的是4个小孩子被一个人PK,那四个小孩子拼命练级最后打败那个人的故事,其中有一句话翻译的很好,
在javaSE中也有metadata的概念,最早的就算是JavaDoc了,在5.0之后,Annotation就是大量的使用metadata了,这是关于源代码的数据,具体来说就是关于Java的类、方法、字段等关联的附加数据。
数据质量一直是ETL工具的一个高级特性,为了解释清楚这个问题,让我们看看oracle的商业ETL工具Oracle Warehouse Builder 在数据质量上是如何管理的
本文中,我们是采用系统配置要平衡的概念进行I/O配置评估,即看待一个系统时,其CPU和内存,主机I/O带宽,存储带宽应是平衡和一致的。合理的配置是保证系统整体性能的关键。
对数据质量管理,这句话也是应该严格遵守的至理名言。越早发现潜在的数据问题,越有可能以较小的成本,较快的速度处理这些问题。在商业系统的应用管理方面,这也是数据质量管理的基本要求。
数据质量一直是ETL工具的一个高级特性,为了解释清楚这个问题,让我们看看oracle的商业ETL工具Oracle Warehouse Builder 在数据质量上是如何管理的
商业智能对每个不同的公司都有不同的定义,文章作者对商业智能平台进行了深入的研究,本文介绍了ETL的metadata。