技术开发 频道

IBM DB2通用数据库和信息管理

  【IT168 技术文章】

  如果您刚接触 IBM DB2 和信息管理软件,没关系,这一“DB2 简史”包含了您快速“启航”所需的信息,包括历史透视、技术概论和许多有助于您入门参考资料。

  简介

  1970 年,IBM 圣何塞研究室的 E. F. Codd 发表了一篇开创了计算机管理信息新方法的论文。他的论文“A Relational Model of Data for Large Shared Data Banks”提出了用于存储、管理和交互操作数据的新体系结构。这一新的关系模型使应用程序开发人员从必须了解被管理数据的详细信息的桎梏中解脱出来。

  4 年以后,IBM 员工 Don Chamberlin和 Ray Boyce 发表了“SEQUEL: A Structured English Query Language”,该论文成为了 SQL 语言标准的基础。用新的 SQL 语言编写问题变得比如何在磁盘存储和组织数据更重要。该语言可以询问和回答功能更强大的新问题。构建应用程序也比以往迅速得多。该关系数据库系统自身承担了更多数据管理的任务,从而使应用程序拥有更多的自由以专注于业务逻辑。

  自 1970 年以来,IBM 已经开发出了完整的关系数据库管理系统(RDBMS)软件系列(现称为 DB2 通用数据库 (Universal Database,UDB))。另外,IBM 还用 DB2 作为“引擎”构建了其它信息管理软件,用途包括数据仓库、数据分析、数据挖掘、媒体资产管理、企业内容管理和信息集成。DB2 和 IBM 信息管理(Information Management)产品组合表示一个产品组合元素,IBM 称之为中间件 - 即充当联结系统和软件应用程序“粘合剂”的软件。DB2 是 IBM 五个软件品牌之一,这五个品牌是:DB2、WebSphere?、Lotus?、Tivoli? 和 Rational。本文介绍了 DB2 和 IBM 信息管理产品组合。

  DB2 简史

  从一开始就成为 DB2 系列扎实的技术来源的一系列研究项目有:

  System R 项目使 IBM 实现了第一个关系模型。

  基于成本的查询优化从 System R 时代开始就一直取得巨大成就和创新。R Star 项目将关系模型扩展至分布式系统环境。

  Starburst 项目专注于扩展关系模型,使之能处理新的信息形式和新的优化策略类型。

  Garlic 项目强调数据联邦,允许一起管理不同系统(而不仅仅是 DB2 系统)中的数据。

  最近,Xperanto 项目已经演示了 Web 服务信息的集成和用于管理 XML 内容的又一功能强大的查询语言 - XQuery 的使用。

  1980 年,最初的 System R 项目首次实现了关系技术:集成到 System/38 服务器的数据库。1982 年,SQL/DS? 产品被用于大型机操作系统 VM 和 VSE,它也是基于 System R 的。DB2(正式名称是 DATABASE 2)于 1983 年诞生于 MVS? 上。1987 年,OS/2? Extended Edition 中的数据库管理器是分布式系统上的首个关系数据库。用于新的 AS/400? 服务器的 SQL/400? 在 1988 年出现。新的 DB2 版本被用于 AIX?(1993)、HP-UX 和 Solaris(1994)、Windows?(1995)和 Linux(1999)。

  DB2 的今天

  如今,DB2 系列跨越了各种 UNIX?、Linux 与 Windows 平台和 IBM iSeries?(OS/400? 操作系统)和 zSeries?(OS/390?、z/OS?、z/VM 和 Linux)服务器系列。DB2 Everyplace? 支持手持设备和嵌入式 Linux 环境,并提供了与更大型系统的数据同步。为整个系列的应用程序开发和数据库管理提供了常用工具。来自所有系列成员的创新以及 2001 年收购的 Informix 数据库系列,满足了整个系列的发展需求。

  如今的 DB2 技术解决了几个新领域中新兴的客户需求:

  自主计算要求服务器、操作系统和中间件(包括 DB2)在无人干涉的情况下诊断和纠正问题。为数据库管理员实现数据库自我管理和自动化是最新版的 DB2 中特别强调的内容。

  基于标准的 Web 服务是作为一种新的 DB2 全力支持的应用程序处理样式出现的。

  网格计算,即将大规模计算资源用作实用程序或服务(包括数据库服务)的思想,利用 DB2 大量群集的可伸缩性,以高度可用的方式来支持大型数据库和同一时间内的大量用户。基于标准的 Web 服务是 DB2 所支持的网格计算的另一个关键组件。

  “ 电子商务随需应变(e-business on demand)”业务模型需要构建在开放标准上的操作环境,以允许进行快速的和符合成本效益的创新和重新配置。用以支持电子商务随需应变的基础架构必须是可靠的、可伸缩的且是安全的。DB2 就是这样一种基础架构。

  除了强大的和创新的技术之外,DB2 还为所有规模的客户提供了很高的价值。UNIX、Linux 和 Windows 系统中的 DB2 定价被业界分析人员公认为大约是其主要竞争对手定价的一半。DBA 自动化和自我管理增强功能与低价结合,为 DB2 客户提供了卓越的价值。

  本文的目的在于向您大致概述由 DB2 中的功能解决的特殊技术领域。正如在一开始,SQL 分担了应用程序开发人员肩上的大部分数据管理负担,这里所描述的各种 DB2 技术通力合作,使今天和明天的应用程序开发人员和数据库管理员能更加专注于解决业务问题。对他们来说,这意味着从管理信息技术性细节中日益解脱。

  深入研究该技术

  DB2 旨在为那些有需求的用户提供强大的功能。但是,人们日益重视可用性和开发的简单性。让我们研究一下那些共同使 DB2 出类拔萃的技术:

  已证实的性能和可伸缩性

  管理(更为简单)

  您所选环境的应用程序开发和部署

  已证实的性能和可伸缩性

  为同时满足支持为数众多的操作系统的需要,以及高性能和高可伸缩性的需要,DB2 是用特定于每种环境的方式开发的。

  在 OS/390 和 z/OS上,DB2 被开发成与操作系统和服务器硬件的增强功能合作。这一紧密集成提供了 DB2“数据共享” - 使用 IBM System/390? 和 zSeries Parallel Sysplex? 硬件体系结构的共享资源群集体系结构。一些世界上最大的数据库就构建在该环境中的 DB2 之上,正如在 Winter Corporation所进行的大型数据库定期研究中提到的那样。

  在 OS/400- IBM iSeries 服务器系列(原先是 AS/400)的操作系统上,DB2 被作为操作系统本身的一部分来实现,支持单服务器和多服务器的并行处理和群集。

  在 UNIX、Linux 和 Windows 平台上,DB2 具有“无共享(shared-nothing)”体系结构,它使公共代码库能在所有这些环境中被使用。DB2 无共享群集中的服务器在总体数据的子集和群集所接收到的 SQL 请求子集上独立和并行地进行工作。事务型(比如 TPC-C)和决策支持(比如 TPC-H)工作负载的 基准测试结果都证明了:具有这种可移植体系结构的 DB2 具有巨大的可伸缩性。

  高可用性和可伸缩性的群集以及对最新处理器和互连技术的支持,都是 DB2 确保客户能够顺利发展的各个方面。DB2 故障转移和备用支持提供了如今所需的高可用性。DB2 对最新的 64 位处理器(Intel Itanium 2 和 AMD Opteron)的支持意味着:可以构建更大型的数据库,并且可以达到更快的性能。诸如 InfiniBand这样的更简单和更快速的群集和连接技术使 DB2 更容易伸缩。对于所有规模的客户和开发人员都得以顺利发展。

  管理(更为简单)

  经济条件和提高底线的愿望意味着:由于受管信息的数量和种类增加,而又没有雇用额外管理员的资源,因此许多 DBA 的工作负荷正变得越来越重。

  DB2 通过许多方法减轻了数据库管理的压力:

  它的控制中心(Control Center)为 DBA 提供了一个中心地点,使他们通过 DB2 系统网络执行工作。

  一批顾问工具提供了专业的资源监控、问题诊断和纠正措施。这方面最新的示例是 Configuration Advisor,用于在 UNIX、Linux 和 Windows 上的新安装中快速获得最高 DB2 性能。另一个示例是 Health Center,它担任许多最近的 DB2 自我管理工作的核心件。其基于规则的问题诊断和纠正措施功能增加了新的 DB2 Performance Expert和 DB2 Recovery Expert 工具(一类新出现的 IBM 数据库工具,提供了前所未有的专业指导和自动操作)。

  从 DB2 诞生开始,基于成本的优化和自动查询重写技术方面就一直持续发展,不断为数据库管理员卸去 DB2 性能管理方面的负担。每个 DB2 新版本的目标在于使数据库管理资源的需求越来越少。IBM 整体上对自主计算的重点关注和投资使 DB2 从中受益。

  

0