【IT168 案例】1. 引言
统计部门的基本职责是搞准统计数字、搞好统计服务。统计数字准确与否、数据质量如何是统计工作的生命线。如何才能降低差错率、误码率,确保统计数据的准确性,从统计诞生的第一天起,人们就千方百计、想方设法进行着实践,结绳记事、书契记数、珠算、手摇计算器、电子计算器、电子计算机等等。随着科技进步和信息革命的不断深化,1946年世界上第一台电子计算机的诞生,统计数据计算手段发生了巨大变化。中国统计同世界统计一样,特别是改革开放30年来,统计数据计算机处理按照“微机起步、从无到有、由小到大、以任务促建设”的建设方针,顺利完成了“八五”、“九五”、“十五”统计信息工程建设任务,全面实现了统计数据处理计算机化、数据传输网络化、信息交流网站化,极大地促进了统计改革、创新和发展,信息化在统计工作中发挥着越来越重要的作用,统计生产力得到了前所未有的巨大提高。
2. 项目背景
统计信息化建设的最终目标是确保统计数据质量和工作效率的提高,实现统计信息资源共享。因此统计信息化建设的各个环节,都要围绕提高和保证统计数据质量这个核心。以内容丰富、结构合理、高效安全、充分共享为特征的统计信息资源建设为核心,建设一个以统计综合数据库为主导的,重点突出、高起点、高标准的统计信息系统,使之成为政府和社会公众的“决策参考智囊库、宏观经济数据库、统计管理信息库”。
依托湖北省信息化基础设施,充分利用现代信息技术,以科学合理的指标体系为基本需求框架,建立政府部门数据交换共享制度,有计划地对全省政府统计部门、政府各职能部门以及国民经济行业主管部门负责搜集的社会经济数据资源进行持续地收集、整合、存储和管理,建设全省统一的宏观经济与社会发展基础数据库系统,提高对政府公共信息资源的管理和共享能力,通过数据交换、资源共享和信息发布平台,为各类应用提供一致的宏观经济与社会发展基础数据,满足政府管理决策、部门信息共享和社会公共服务“三个层次”的需求。
3. 系统概述
图3-1 系统总体架构图
3.1系统建设目的
a) 为各级党政领导提供准确、及时、全面、方便的数据查询服务,为经济预测和宏观决策提供有效支持。
b) 实现统计信息资源的全社会共享,为政府机构、企业单位和社会公众提供统计公共产品及服务。
3.2系统建设的原则
a) 先进性
系统在设计上采用三层结构(浏览器、应用服务器、数据库管理系统),在选用平台、采用技术上具有先进性、前瞻性、扩充性,从而保证建成的系统具有良好的稳定性、可扩展性和安全性。
b) 实用性
考虑到要尽量满足业务功能需求的前提下,又要适应各业务角色的工作特点,该系统做到了简单、实用、人性化,实现统一身份和资源管理、统一认证、统一内容管理、个性化界面。
c) 可靠性
必须保证系统的可靠性和安全性。系统设计中,应用软件具有良好的容错性、容灾性等。
d) 开放性
在系统构架、采用技术、选用平台方面都应有较好的开放性。特别是在选择产品上,应采用符合开放性要求,遵循国际标准化组织的技术标准(如HTTP、HTML、J2EE、XML、WML、cHTML、UDDI、SOAP、WSDL、JSR168、JSR170、WSRP等),共同构成一个开放的、易扩充的、稳定的、统一的软件系统。
e) 可维护性
开发设计应标准化、规范化,按照分层设计,软件构件化实现。采用软件构件化的开发方式:一是系统结构分层,业务与实现分离,逻辑与数据分离;二是以统一的服务接口规范为核心,使用开放标准;三是构件语意描述形式化;四是提炼封装构件规范化。
f) 可伸缩性
考虑到政务系统的网上业务建设是一个循序渐进、不断扩充的过程,系统应采用积木式结构,整体构架可以与原有系统进行无缝连接,为今后系统扩展和集成留有扩充余量。
g) 可移植性
选择开放的应用平台,建设一套跨平台,以统一的服务接口规范和与各种数据库相连的应用组件。
3.3系统总体设计要求
a) 合理利用网络资源
充分考虑系统安全问题,对不同网络条件下各种业务功能的实现采用合理的架构(B/S、C/M/S)。设计中采用B/S架构设计的部分,要求客户端零安装,不允许使用任何Java Applet或ActiveX控件。直报(采集、审核)、信息发布等功能必须采用B/S结构。
b) 顶层设计,分布实施
在第一周期工程设计中,应该从统计业务系统建设一体化为出发点来全局的考虑,要通过保证整个统计业务流程从[制度定义]到[数据采集]到[数据整理]到[数据发布]等各个环节软件的无缝连接与业务的流畅性,要充分考虑统计业务的多变性、灵活性、指标的变化以及软件功能的完备。在数据库平台的建设中,充分考虑内外数据资源的共享、数据/指标标准的建设及系统接口标准的制定,为以后业务需求变化和第二周期工程的扩展做好准备。
c) 基于元数据理论
对于本次系统建设中的数据库设计部分,必须充分考虑元数据理论在统计系统中的应用。同时,针对统计数据量大、审核业务、数据处理业务繁重和数据灵活使用的特点,在数据库设计时,必须充分考虑对数据库的优化。
d) 先进的技术
系统的设计应采用先进的技术,比如J2EE、XML、Web Service、数据仓库、元数据等先进的软件技术和理论。报表设计等复杂程序采用客户端方式实现,采用VC++、Delphi等语言开发,运行程序不需要安装JAVA虚拟机或Framework运行环境,不需要手工安装Oracle客户端。
e) 高可移植性
系统可以方便的移植到HP-Unix、IBM AIX等高性能小型机操作系统上。
f) 针对业务特殊性的设计
与别的电子政务系统相比,统计系统有其特殊的业务特点,包括对审核的严格要求、数据量大、数据来源多样、分块分级分部门管理等。
g) 开放的架构
系统支持多台服务器部署,可以将直报服务、公众查询服务、领导查询服务、管理员管理服务、数据库服务、汇总与审核服务单独部署到多台物理分离的服务器中。
h) 高性能
从系统的设计方面支持大并发量、大数据量的数据报送、查询和汇总等业务处理。
i) 良好的伸缩性
考虑到政务系统的业务建设是一个循序渐进、不断扩充的过程,系统应采用分层的结构,整体构架可以与原有系统进行无缝连接,为今后系统扩展和集成留有扩充余量。
j) 友好的交互界面
对于大数据量的信息需要采用分页方式处理。页面信息不得显示过长。界面需要美观清晰。地区字典等多层次信息的选择采用树状结构显示。操作换页不可过于频繁。
k) 权限管理明晰
系统的用户层次清晰,分角色管理。不同的用户所见的菜单和界面不同。
l) 遵循省电子政务规范
遵守湖北省电子政务系统规范和标准要求。
m) 高安全性
B/S系统登录界面需要通过程序动态产生带干扰文的验证码,防止黑客采用自动程序试探系统密码。
n) 版权清晰
系统版权必须清晰,不可有非法第三方的组件和控件。
4. 系统特点及达梦数据库在项目中的作用
4.1系统特点
4.1.1 J2EE体系架构
J2EE提供了一套企业级Java应用框架(一种标准),是一种利用Java 2平台来简化企业解决方案的开发、部署和管理相关的复杂问题的体系结构。J2EE使用多层的分布式应用模型,应用逻辑按功能划分为组件,各个应用组件根据他们所在的层分布在不同的机器上。J2EE为搭建具有可伸缩性、灵活性、易维护性的商务系统提供了良好的机制。
图4-1 J2EE 典型四层结构图
4.1.2基于三层的应用技术
三层结构是将应用功能分成表示层、业务逻辑层和数据层三部分。其解决方案是对这三层进行明确分割,并在逻辑上使其独立。各层说明如下:
表示层:担负用户与应用间的对话功能,通过浏览器模式实现表示层,组成的B/S结构;或使用可以自动更新的瘦客户端软件实现表示层,组成基于三层体系的“瘦客户/服务器”结构。
业务逻辑层:包含了具体的业务处理逻辑程序相当于应用的本体。
数据层:负责管理对数据库数据的读写。主要是利用大型关系型数据库进行迅速、大量的数据处理。
4.1.3基于CWM标准的统一元数据管理
按照传统的定义,元数据(Metadata)是关于数据的数据。在数据仓库系统中,元数据可以帮助数据仓库管理员和数据仓库的开发人员非常方便地找到他们所关心的数据;元数据是描述数据仓库内数据的结构和建立方法的数据,可将其按用途的不同分为两类:技术元数据(Technical Metadata)和业务元数据(Business Metadata)。
技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据;业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。业务元数据主要包括以下信息:使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数据的来源;系统所提供的分析方法以及公式和报表的信息。
数据仓库的建设是信息集成项目,因为它的主要工作是把所需的数据仓库工具集成在一起,完成数据的抽取、转换和加载,OLAP分析和数据挖掘等。
4.1.4数据仓库技术
数据仓库的概念是为企业能有效地管理和利用多年来积累下来的各种历史数据和统计信息,服务于决策支持背景下提出来的。数据仓库之父W.H.Inmon在《建立数据仓库》一书中提出:数据仓库就是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程。这个定义所陈述的是一种设计方法,它偏重于对数据本身特点和数据模型特点的描述,主要是针对解决数据“易进不易出”的问题。
数据仓库将不同介质、不同组织方式的数据集成转换而成为一个一致的分析型数据环境,为不同来源的数据提供了一致的数据视图。它的最大优点在于它能把企业网络中不同信息岛上的数据集中到一起,存储在一个单一的集成的数据库中,并提供各种手段对数据进行统计、分析,并且允许企业的各个部门共享数据,为企业更快、更好地做出决策提供更加准确、完整的信息。
面向主题性是数据仓库中数据组织的基本原则,数据仓库中的所有数据都是围绕着某一主题组织、展开的。数据仓库中存贮的数据是从原来分散的各个子系统中提取出来的,但并不是原有数据的简单拷贝,而是经过统一、综合的。数据仓库在一定时间间隔内是稳定的,其中数据随时间变化而定期地被更新。
图4-3 数据的转换与集成
4.1.5基于EAI的数据交换技术
a) 构建协同建模
可视化集成器基于《OMG的企业分布式对象计算(EDOC)规范》,采用直观拖放构件方法实现构件协同建模,简化集成过程。可视化集成器提供EAI构件模型库,集成服务提供相应的构件库,这为积累和重用应用集成构件,提供了一个通用的业务构件平台。针对不同业务部门的各种需求变化,通过使用可视化集成器,能够灵活应对。
b) 消息发布/订阅
集成服务支持基于发布/订阅的消息分发和路由,能够实现消息的推和拉两种模式。集成服务可配置为不同的消息域,组成跨集成服务节点的集群。
c) 高性能数据交换
集成服务提供三种消息队列存贮方式,即持久、内存和高速缓存,满足不同的数据交换的需求。持久存贮:基于数据库的持久,提供可靠消息持久功能,具有最小的内存开销,适合于消息需要可靠传输,实效不强的应用环境;内存存贮:基于内存的消息队列,不提供消息持久功能,完全基于内存来进行消息的缓存和分发,适合实效性强,无需可靠传输的应用环境;高速缓存:基于数据库和内存Cache的持久,提供可靠持久功能,同时又使用内存作为Cache,因此具有最大的资源开销,同时又具有很高的性能,适用大部分应用环境。
d) 多种传输协议接入
集成服务通过协议插件对外提供不同客户端的接入,协议插件由协议插件管理器来配置管理。目前,集成服务支持IIOP、RMI、Socket 、XML/RPC、JMS、JCA等传输协议。
e) 数据库数据增量抽取
可通过MD5方式实现数据增量抽取,同时还提供基于快照表和基于条件(如时间域段)的数据增量抽取。其中快照表可以由系统自动生成,也可由用户指定。数据抽取的策略可配置,有实时、轮询和定时等多种抽取策略。
f) 异构数据库之间的数据复制和同步
支持主流的数据库(Oracle、DB2、Sybase、SQL Server、Access、Informix、Foxpro等)及国产数据库之间的数据复制和同步。数据复制和同步是指数据源被增加、更新和删除,能在目的数据中即时反映。异构数据库之间的映射,可以自动实现或用户指定。
g) 故障的自诊断、自恢复
管理服务将监控各服务进程,通过进程间的通讯,对服务进程进行诊断。如果发现服务进程出现严重问题,将策略性终止服务进程,并进行服务重启,以保证业务系统的正常工作。服务重启,将保证有可靠性要求的消息队列、会话、发布者和订阅者的自动恢复,并重载终止前的构件。
h) 技术标准与国际同步
保持与OMG的CORBA、EAI和EDOC标准或规范的同步。
4.1.6 SOA面向服务架构
SOA是英文Service-Oriented Architecture,即面向服务架构的缩写。简单来说,SOA就是一种进行系统开发的新的体系架构,在基于SOA架构的系统中,具体应用程序的功能是由一些松耦合并且具有统一接口定义方式的组件(也就是Service)组合构建起来的。本质上说,SOA体现的是一种新的系统架构,SOA的出现,将为整个企业级软件架构设计带来巨大的影响。
基于B/S的分布式计算来说,SOA是一场革命。一个应用程序的业务逻辑(Business Logic)或某些单独的功能被模块化并作为服务呈现给消费者或客户端。这些服务的关键是他们的松耦合特性。例如,服务的接口和实现相独立。应用开发人员或者系统集成者可以通过组合一个或多个服务来构建应用,而无须理解服务的底层实现。举例来说,一个服务可以用J2EE来实现,而使用该服务的应用程序可以在不同的平台之上,使用的语言也可以不同。
SOA伴随着无处不在的标准,为企业的现有资产或投资带来了更好的重用性。SOA能够在最新的和现有的应用之上创建应用;SOA能够使客户或服务消费者免予服务实现的改变所带来的影响;SOA能够升级单个服务或服务消费者而无需重写整个应用,也无需保留已经不再适用于新需求的现有系统。总而言之,SOA以借助现有的应用来组合产生新服务的敏捷方式,提供给企业更好的灵活性来构建应用程序和业务流程。
4.1.7 SSO服务
SSO是Single Sign-On的简写,即单点登陆。其思想是任意登陆一个系统后,在进入其他应用系统的时候不需要再次进行用户登陆操作,直接由系统通过权限、身份认证来完成用户的登陆。
政府部门和各企业在一同时期建设了大量的应用系统,分别建立在不同的系统平台之上,或由不同的开发商开发完成的,这些系统普遍缺少统一的规划,造成各个系统之间相互孤立,每个系统都有自己的一套用户名/口令,这样每个人都要记住自己在每个系统中的用户名/口令,造成很大麻烦,经常发生忘记口令,请系统维护人员解决的情况发生;有的管理人员干脆把各自系统的用户名及口令完全设成一样,这样又给系统的安全性带来了很大的隐患,一旦用户的口令被别人知道了,非法用户将轻易进入所有系统。
为解决该问题,SSO服务将需要多次登录不同应用系统改为单点登录。用户只需登录SSO服务,就可以进入其它有权访问的应用系统,而不需要重新登录,系统会自动按用户自己的设置,以其身份登录进入相应的应用系统。
4.1.8灵活的报表处理
传统的报表工具,难以适应网络环境的变化;一些单纯的报表控件,需要大量编程才能实现格式的组织、数据的获取和填充,不能进行设计、部署、生成、展现、打印全过程自动化支持;而一些国外的西式报表工具,对那些不规整的复杂的中国式报表也不能简便地实现。
通过使用针对B/S模式下开发复杂的中国式报表所面临的问题而研发的报表中间件,主要面向B/S结构应用,同时兼顾C/S结构应用,是快速实现中西式复杂报表的设计、部署、生成、展现、打印和管理的开发运行平台。采用和Excel风格类似的单元格网格布局来设计报表格式,通过报表模型组织数据自动填充报表数据,支持各种类型的复杂报表,“所见即所得”的图形化方式设计报表,支持证件和票据套打,适应多种平台及数据库环境,并可以跟应用无缝集成,可以快速构建复杂的报表应用。
4.2达梦数据库在项目中的作用
a) 合理组织、明确责任
在工程实施时,达梦公司与业主等各方人员共同成立工程领导小组,工程领导小组按照项目管理的办法,授权项目负责人对整个工程进行管理和控制。项目管理组下设若干个工程工作组,对各工程工作组的职责、工作流程以及管理细则,严格按照ISO 9001和CMMI等工程管理规范进行详细的界定。
b) 统一规范,并行实施
在工程实施准备阶段,完成具体详细的安装实施方案和规范,各项目小组必须严格按照规范实施,从而保证了实施情况的统一和实施的质量。
c) 统一协调管理
建议由达梦公司和业主一起组成领导小组和专家小组在实施期间常驻湖北省统计局,对工程中出现的问题,集中讨论定出解决方案后,下发项目小组实施。这样有效提高了协调的效率,加快了问题定位和解决的速度和质量。
d) 使用项目管理工具
利用工作任务分析表(甘特图)、项目网状图、关键性通道分析等项目管理工具,严格对工程进度实行计划管理。
e) 集中监控,定期汇报
各项目小组通过工程简报等方式向项目经理汇报项目进展和问题。项目经理通过工作细分、定期召开会议、提交报告及制定详细的管理流程,对整个工程进行协调和控制,并在工程的每个阶段设定明确的阶段目标,对工程项目实施有效的质量控制。
5. 达梦数据库在项目中体现出的优势
多年来,达梦数据库有限公司一直采用国际上普遍推行的项目管理办法对众多大型工程进行有效的组织和管理,并积累了丰富的工程管理经验。达梦公司先后通过了ISO9001质量保证体系和CMMI(软件能力过程成熟度模型)质量管理体系的认证。在实施CMMI过程中,达梦公司形成了严格的质量管理方针,并构建了本公司的质量管理平台。
通过项目管理,保证软件开发的全过程处于受控状态,软件的质量和开发进度得到有效地保证。按照CMMI质量管理体系要求,通过公司质量控制部人员及公司技术评审委员会和项目评审委员会人员适时参与项目在组织上保证各项质量活动的有序进行。
图5-1 达梦CMMI质量管理体系和项目管理体系图示
达梦公司的质量管理体系(QMS)通过管理过程来控制产品或工程质量。而过程是为了达到给定目标所实施的一系列步骤,就是人们使用相应的规程、方法、工具和设备将原始材料(输入)转化成面向客户的产品(输出)所做的事情。
实施CMMI项目管理体系,将作到管理靠流程,实施靠规范,事事有记录,检查有反馈,处理有结果,形成一个以预防为主、全程受控、紧密衔接的闭环运行体系。
在整个过程的每个阶段,达梦公司会按照严格的要求,产生各阶段的详细文档,在整个项目的实施过程中和用户保持密切的交流,从而保证在每个阶段中都能反映用户的意见,使整个过程实施流畅,将系统的返工率降到最低。
达梦公司QMS程序进行了以下活动的定义和管理:
图5-2 QMS程序图
6. 小结
21世纪信息化的浪潮席卷全球,统计信息化也必将以超想象力的发展速度飞速前进,统计工作必将迎来一场深刻的变革。统计工作全面信息化的实现,全国统计系统使用统一业务平台软件系统,依托数据仓库技术、网络技术、地理信息技术,实现统计业务手段现代化,改变统计业务传统的“手工作坊”模式,把广大统计业务人员从繁琐的常规简单数据加工中解放出来,把更多的精力投入到数据质量与保障工作中去,必将全面提高统计数据质量,统计分析水平也必将登上一个新的台阶,可以向国际先进水平发展。达梦公司将根据潮流发展,不断提升研发水平,设计出更多更好的数据库产品助力统计信息化这项伟大工程。