技术开发 频道

数据库科学家Don Chamberlin做客IT168

【IT168技术资讯】
   作为第一种获得商业成功的关系数据库语言,SQL为关系数据库20多年的兴盛作了不可磨灭的贡献。今天(8月28号),SQL的发明者之一、数据库科学家Don Chamberlin先生将做客IT168和中国最大的数据库社区ITPUB。

    与专家面对面,你可以了解到:数据五十年中数据管理技术的进展,以及不同历史时期,人们存储和处理信息的思路和方法;在Web的影响下,结构化和非结构化数据管理的趋同化趋势。另外,还可以了解到SQL发明幕后的故事等内容。
   
    话题包括:
1. 50年来,数据管理走过了怎样的历程?
2. SQL的发明过程中包含了哪些幕后的故事?
3. 适应XML的检索语言的研究进程如何?
4. 中国高校的数据库教育主要包括哪些内容?其内容是否能适应社会的需要?
5. 每一次数据库技术的更新换代,IBM都是中流砥柱,这其中有何秘诀?
6. 前沿数据库技术在中国的推广策略和应用前景。 
 

    资料:
    2003年对Don Chamberlin 来说,可以说是收获之年:这一年他获得了 IBM 公司技术方面的最高荣誉 IBM 名士(Fellow)称号;获得了 ACM SIGMOD 颁发的创新奖;获得了母校 Harvey Mudd 学院的杰出校友奖; 特别是,他还获得了《软件研发》英文版《Dr. Dobb'sJournal》颁发的 Dr. Dobb's 程序设计杰出奖 (Excellence in Programming Award),与 Linus Torvalds、James Gosling、Anders Hejlsberg 等一起载入史册。

    Don Chamberlin 获得这些殊荣当然是无愧的:是他发起了数据查询的两次革命,他是 SQL 语言的创造者之一,也是 XQuery 语言的创造者之一。今天数以百亿美元的数据库市场的形成,与他的贡献是分不开的。

    Don Chamberlin 似乎天生与数据库、信息检索有缘:小的时候,家里的一本 100 多磅重的百科全书是他的最爱,在他看来,这大概是数据库的最早形式。作为地地道道的硅谷人,他的本科是在规模很小但是声誉很高的 Harvey Mudd 学院度过的,这个学校至今仍然保持每年从 1600 多名申请者中仅招收 100 多名学生的制度。

    在斯坦福大学获得博士学位以后,Chamberlin 加入了位于纽约的 IBM T.J.Watson 研究中心。那里汇聚了当时计算机界的大批精英,主要研究方向是操作系统。Chamberlin 一开始从事的项目是 System A,一年后,项目最终失败。当时担任项目经理的 Leonard Liu(后来曾担任 Cadence 公司首席运营官)很有远见地预见到数据库的美好前景,他转变了整个小组的方向。Chamberlin 从此如鱼得水,在数据库软件和查询语言方面进行了大量研究。他成了小组中最好的网状数据库 CODASYL 专家,整日徜徉在复杂指针和集合选择规则的海洋中。与此同时,20 世纪 60 年代晚期,在美国西海岸 IBM 圣何塞研究中心(Almaden研究中心的前身)工作的数学家 Edgar Codd 独自创造了关系数据库的概念。但是,由于这种思想对 IBM 本身已有产品造成了威胁,公司内部最初是持压制态度的。当然这也与 Codd 采用了太多数学方法(以谓词演算为基础),不容易理解有关。在 Codd 里程碑性的论文"A Relational Model of Datafor Large Shared Data Banks"以及许多重要的后续论文公开发表之后,IBM 研究中心从事数据库的研究人员中,还有不少人以怪异思想视之,或者半信半疑,或者完全摸不着头脑的,甚至有人做出如此轻蔑的评论:"这东西过十年再说吧。"

    一天, Codd 到 Watson 研究中心访问, 在讨论会上, 他几乎用一行语句就完成了类似于"寻找比他的经理挣得还多的雇员"这样的查询。"我的天!"Chamberlin 知道,这个查询用 CODASYL 来表示的话,可能要超过 5 页纸。这种强大的功能使 Chamberlin 醍醐灌顶,幡然醒悟,从此转向了关系数据库。

    在其后的研究过程中,富于程序员气质的 Chamberlin 相信,Codd 提出的关系代数和关系演算过于数学化,无法成为广大程序员和使用者的编程工具,这个问题不解决,关系数据库也就无法普及。因此他和刚刚加盟的 Ray Boyce 设想出一种操纵值集合的关系表达式语言-- SQUARE(Specifying Queries as Relational Expressions)。

    1973 年,IBM 在外部竞争压力下,开始加强在关系数据库方面的投入。Chamberlin 和 Boyce 都被调到圣何塞,加入新成立的项目 System R。当时这个项目阵容十分豪华,有 Jim Gray ,Pat Selinger,和 Don Haderle 等数位后来的数据库界大腕。

    System R 项目分成研究高层的 RDS(关系数据系统)和研究底层的 RSS(研究存储系统)两个小组。Chamberlin 是 RDS 组的经理。由于 SQUARE 使用的一些符号键盘不支持,影响了易用性,Chamberlin 和 Boyce 决心进行修改。他们选择了自然语言作为方向,其结果就是"结构化英语查询语言(Structured English Query Language,SEQUEL)"的诞生。当然,后来因为 SEQUEL 这个名字英国已经被一家飞机制造公司注册了商标,最后不得不改称 SQL。有趣的是,他们的野心很大,想借此实现非程序员也就是普通大众也能广泛应用计算机的梦想(当然,那时候还没有图形界面)。因此,项目组找来了一位语言学家,她跑到圣何塞州立大学,找了许多不懂计算机的大学生,教授他们 SEQUEL 和 SQUARE 两种语言,像白居易当年对老妪吟诗那样,寻找改进的方案。他们的梦想当然并没有实现,然而,SQL 的简洁、直观还是使它迅速成为了世界标准(1986 年ANSI/ISO),30 年后仍然占据主流地位。而经过了 1989、1992、1999 和 2003 年四次修订,当初仅 20 多页的论文就能说完的 SQL,如今已经发展为篇幅达到数千页的国际标准。

    1988 年,由于"革命性地改变了数据库系统行业的面貌",System R 和伯克利分校开发的竞争系统 INGRES 共同获得了 ACM 颁发的"软件系统奖",Chamberlin 是 9 位获奖者之一。

    此后,Chamberlin 曾一度顺应个人电脑的大潮,对桌面出版发生了兴趣。他领导了一个小组开发了一种文档编辑/格式化程序,名为 Quill。其中文档的逻辑视图是用 SGML 保存的。这是 Chamberlin 第一次接触标记语言。

    20 世纪 90 年代,Chamberlin 再次返回数据库世界,开始从事对象--关系数据库的开发,其成果在 DB2 中得到了体现。其间他曾撰写过一本专门讲 DB2 的书《A Complete Guide to DB2 Universal Database》(Morgan Kaufmann,1998)。在网络时代到来,XML 日益成为标准数据交换格式的时候,Don 看到了自己两方面研究经验--数据库查询语言和文档标记语言相结合的非常好的时机。他成为 IBM 在 W3C XML Query 工作组的代表,并与工作组中两位同事 Jonathan Robie 和 Dana Florescu 一起开发了 Quilt 语言,这构成了 XQuery 语言的基础。而后者经过多年快速发展,即将成为 W3C 的候选标准。对于 Chamberlin 来说,XQuery 语言标志着自己"整个职业生涯中的又一个高峰。"他深信 Web 数据技术的发展将带来第二次数据库革命。

    Chamberlin 的学术成就,使他 1994 年当选为 ACM 院士,1997 年当选为美国工程院院士。他对于教育一直很有兴趣,多年来一直担任 ACM 国际大专程序设计竞赛(ICPC)的出题人和裁判。
0
相关文章