技术开发 频道

软硬结合三步曲 甲骨文大数据方案盘点

  二、组织大数据

  在传统的数据仓库术语中,组织数据称作数据集成。大数据的数据量之大造成了很多情况下都是在其原始存储位置组织数据,而不迁移大量的数据,这样做既省时又省钱。数据的预处理过程将剔除价值较低的数据,并对余下的数据进行结构化处理以用于分析。由于大数据形态多样、大小不一且格式各异,因此这一转换过程是将数据移入分析环境的重要先决条件。

  大数据平台在将大量数据加载到企业数据仓库之前需要对其进行批处理和并行处理——过滤、转换和分类。在大数据的组织环节,甲骨文提供了Oracle大数据机、Oracle大数据连接器和Oracle Data Integrator三款产品,下面将重点介绍Oracle大数据机。

组织和分析大数据

  Oracle大数据机是一个集成式系统,它专门经过优化,以便将非结构化数据捕获、组织和加载到Oracle数据库中。该系统将优化的硬件组件与新的软件解决方案相结合,可提供最全面的大数据解决方案。

  Oracle大数据机采用全机架配置,有18台Oracle Sun服务器,总存储容量为648TB。机架中的每台服务器各有2个CPU,每个CPU各有6个内核,因此每个全机架共有216个内核。每台服务器有48GB内存,因此每个全机架共有864 GB内存。

  Oracle大数据机同时包含开源软件和Oracle开发的专用软件来满足企业大数据需求。Oracle大数据机集成软件包括:Cloudera Distribution including Apache Hadoop (CDH) 的完全发布版、用于对Cloudera CDH进行全面管理的Cloudera Manager、统计包R的开源发布版(用于分析Oracle大数据机上未筛选的数据)、Oracle NoSQL Database社区版,以及Oracle Enterprise Linux操作系统和Oracle Java VM。

  三、分析大数据

  由于在组织阶段并不总是移动数据,因此分析也可能在分布式环境中进行,这种情况下某些数据将停留在其原始存储位置,并可从数据仓库透明访问。分析解决方案必须能够集成大数据与传统企业数据的组合分析。

  在大数据分析阶段,Oracle提供了Oracle Exadata数据库云服务器、Oracle Exalytics商务智能云服务器、Oracle数据仓库和Oracle高级分析等解决方案。下面重点讲讲Oracle Exalytics商务智能云服务器。

  Oracle Exalytics是基于嵌入式内存数据库TimesTen的实时BI分析产品。使用了并行一切(Parallel Everything)架构,其中包含1TB DRAM内存,4个10核Intel至强处理器,H/W扫描率达到200GB/S,意味着可以在5秒钟之内对5TB数据库进行完整的扫描,40Gbps的InfiniBand加上1-10Gbps的以太网,提供Exadata以及Exalogic更好的兼容性。

  Oracle商业智能基础包括了在Oracle商务智能企业版和 Oracle Essbase内用于并行执行和内存分析的一整套广泛的新功能,可通过亚秒级的响应速度,为用户提供实时极速可视化分析。面向Exalytics的Oracle TimesTen内存数据库,是一款业界领先的内存RDBMS新版本,并专门为用于分析而设计。

  通过Oracle Exalytics商务智能云服务器,企业可以提供定制化和打包的分析和绩效管理应用软件,这些应用比以往任何时候运行速度更快,更容易使用,并能支持更多用户。通过在单一环境内运行所有的情景模型、规划和预测,该集成系统使客户能完善其控制板和报告项目。

  小结

  甲骨文通过捕获、组织和分析这三步曲,为用户提供一套完整的大数据解决方案。凭借其在数据库行业多年的领导地位,以及对大数据市场环境的正确预测,甲骨文目前的发展依然顺风顺水。在收购SUN后,甲骨文软硬结合的产品策略,也符合当前的发展趋势。

0
相关文章