【IT168 技术文章】
逻辑模型的工具——只反映信息在系统中流动和处理情况的图称为数据流图,它是描述系统逻辑模型的工具之一。数据流图(Data Flow Diagram,简称DFD)是便于用户理解系统数据流程的图形表示。它能精确地在逻辑上描述系统的功能、输入、输出和数据存贮等,而摆脱了其物理内容。数据流图是系统逻辑模型的重要组成部分。
系统分析阶段必须进行全面准确的收集、整理、分析收集的数据及其流程。
一、数据收集
数据收集工作量很大, 故要求系统研制人员应具备经营管理的素质,耐心细致地深入实际,配合业务人员收集与系统有关的一切数据。
1.数据收集的渠道
现行的组织机构;现行系统的业务流程;现行的决策方式;各种报表、报告、图示。
2.数据的来源
(1)组织的正式报告(对于手工系统而言):各种卡片、报表;会议决议。
(2)现行系统的说明性文件(对于已局部计算机化了的系统而言):各种流程图;计算机文件(数据库)系统的数据组织结构。
(3)组织外的数据来源:上级下达的各种文件和各项任务指标;与本单位密切相关的其它单位的有关信息。
3.收集数据的方法
(1)查阅档案:到各个科室按收集数据的类型,查阅档案材料。有时候没有现成的档案,系统分析员就要帮助这些部门建立档案材料。如一个企业的各种报表应该汇编成册,每张报表编上号,注明用途、填报单位、报送单位、月用量、年用量等。如果企业没有做这方面的工作,我们只好自己动手去收集这些报表,编成册,统一标号,调查各种使用情况,作为技术档案资料保存起来,以备日后查阅。
(2)面谈调查:对各级管理人员和工作人员要自上而下地进行访问。调查有关系统总貌、系统目标、环境约束、近年内信息的需求情况,以及他们对现有信息系统的看法(包括有哪些信息是多余的,有哪些或哪方面的信息是急需补充和加强的等等)。
(3)发调查表:对于要作普遍调查的问题,可以发调查表进行调查。
(4)测定:有些数据,如业务的吞吐量、各项工作的时间和费用要实测一段时间。
(5)采样:对于大规模的统计,因不可能收集到数据的全部,可以采用抽样的办法解决。抽样的方式有随机抽样和系统抽样两种,它们的区别在于是不是按一定的规则来抽取样本。样本的大小应根据抽样理论和实际要求来确定。
(6)实际动手:深入实际,亲自动手参加信息的处理工作,这样能加深体会,对我们今后的工作是很有帮助的。
4.数据调查内容
输入信息:输入信息名称;使用目的;搜集方式;发生周期;信息量;编码方式;保存期;相关业务;使用文字;其它。
输出信息:输出信息名称;使用单位;使用目的;发行份数;发送方法;使用文字;输出时间;输出方式;其它。
信息处理过程:处理内容;处理周期;处理方法;处理时间;处理场所;其它。
存储方式:文件名称;保管单位;保存时间;总信息量;保密要求;使用频率;删除周期;追加周期;增加、删除比率。
代码信息:代码名称;分类方式;编码方式;使用目的;起始码;终止码;未使用码;贝码率;追加或废弃频率;其它。
信息需求:所需信息名称;需求目的;需求单位;需求者;时间和期限;所需信息的形式;信息表达的要求。
二、数据分析
收集上来的数据是“ 原材料”,其中有些数据不能用作系统设计的依据,要把这些原材料加工成系统设计可用的资料,就必须做数据的分析工作。数据分析包括以下几个方面:
1.围绕系统目标进行分析
(1)从业务处理角度来看。为了满足正常的信息处理业务,需要哪些信息,哪些信息是冗余的,哪些信息暂缺,有待于进一步收集。
(2)从管理角度来看。为了满足科学管理的需要,应该分析这些信息的精度如何,能否满足管理的需要;信息的及时性如何,可行的处理区间如何,能否满足对生产过程及时进行处理的需求;对于一些定量化的分析(如预测、控制等)能否提供信息支持等等。
2.弄清信息源周围的环境
对数据进行分析就必须分清,这些信息是从现存组织结构中哪个部门来的,目前用途如何,受周围哪些环境影响较大(如有的信息受具体统计人员的计算方法影响较大;有的信息受检测手段的影响较大;有的受外界条件影响起伏变化较大),它的上一级(或称层次)信息结构是什么,下一级的信息结构是什么等等。
3.围绕现存的业务流程进行分析
围绕现存的业务流程进行分析包括:
(1)分析现有报表的数据是否全面,是否满足管理的需要,是否正确反映业务实物流。
(2)分析业务流程,现存的业务流程有哪些弊病,需要做出哪些改进;做出这些改进以后对信息与信息流应该做出什么样的相应改进,对信息的收集、加工、处理有哪些新要求等等。
(3)根据业务流程分析,哪些信息是多余的,哪些是系统内部可以产生的,哪些需要长期保存。
4.数据特征分析
数据特征分析是下一步设计工作的准备工作。特征分析包括以下几方面的内容:
(1)数据的类型以及长度
是数字型还是字符型,是定长的还是变长的, 长度多少(字节数),以及有何特殊要求(如精度、正负号)等等。
(2)合理的取值范围
这对于将来设计校验和审核功能都是十分必要的。
(3)数据所属业务
哪些业务要用到这个数据。
(4)数据业务量
每天、每周、每月的业务量 (包括平均数量、最低的可能值、最高的可能值)以及要存储的量有多少,要输入、输出的频率有多大。
(5)数据重要程度和保密程度
重要程度即对于检验功能的要求有多高,对后备储存的必要性如何。保密度即是否需要有加密措施,它的读、写、改、看权限如何等等。
三、数据流图(DFD)
1.数据流图的基本符号
数据流图由四种基本符号组成,见图5-4-1所示。

图5-4-1 数据流图的基本符号
例:图5-4-2是一个简单的数据流图,它表示数据X从源S流出,经P加工转换成Y,接着经P加工转换为Z,在加工过程中从F中读取数据。
图5-4-2 数据流图举例
下面来详细讨论各基本符号的使用方法。
2.数据流
数据流由一组确定的数据组成。例如“发票”为一个数据流,它由品名、规格、单位、单价、数量等数据组成。数据流用带有名字的具有箭头的线段表示,名字称为数据流名,表示流经的数据,箭头表示流向。数据流可以从加工流向加工,也可以从加工流进、流出文件,还可以从源点流向加工或从加工流向终点。
对数据流的表示有以下约定:
对流进或流出文件的数据流不需标注名字,因为文件本身就足以说明数据流。而别的数据流则必须标出名字,名字应能反映数据流的含义。
数据流不允许同名。
两个数据流在结构上相同是允许的,但必须体现人们对数据流的不同理解。例如图5-4-3(a)中的合理领料单与领料单两个数据流,它们的结构相同,但前者增加了合理性这一信息。
两个加工之间可以有几股不同的数据流,这是由于它们的用途不同,或它们之间没有联系,或它们的流动时间不同,如图5-4-3(b)所示。

(a) (b) (c)
图5-4-3 简单数据流图举例
数据流图描述的是数据流而不是控制流。如图5-4-3 (c)中,“月末”只是为了激发加工“计算工资”,是一个控制流而不是数据流,所以应从图中删去。
3.加工处理
加工处理是对数据进行的操作,它把流入的数据流转换为流出的数据流。每个加工处理都应取一个名字表示它的含义,并规定一个编号用来标识该加工在层次分解中的位置。名字中必须包含一个动词,例如“计算”、“打印”等。
对数据加工转换的方式有两种:
改变数据的结构,例如将数组中各数据重新排序;
产生新的数据,例如对原来的数据总计、求平均等值。
4.文件
文件是存贮数据的工具。文件名应与它的内容一致,写在开口长条内。从文件流入或流出数据流时,数据流方向是很重要的。如果是读文件,则数据流的方向应从文件流出,写文件时则相反;如果是又读又写,则数据流是双向的。在修改文件时,虽然必须首先读文件,但其本质是写文件,因此数据流应流向文件,而不是双向。
例如,在图5-4-3 (a)中,检查合理性加工时,只从库存帐目文件中读出库存信息与领料单核对,所以数据流从文件流出,箭头指向加工。
5.数据源或终点
数据源和终点表示数据的外部来源和去处。它通常是系统之外的人员或组织,不受系统控制。
为了避免在数据流图上出现线条交叉,同一个源点、终点或文件均可在不同位置多次出现,这时要在源(终)点符号的右下方画小斜线,或在文件符号左边画竖线,以示重复,如图5-4-4所示。
图5-4-4 重复的源点、终点或文件
由上图可见,数据流图可通过基本符号直观地表示系统的数据流程、加工、存贮等过程。但它不能表达每个数据和加工的具体、详细的含义,这些信息需要在“数据字典”和“加工说明”中表达。
6.DFD的画法
一般遵循“由外向里”的原则,即先确定系统的边界或范围,再考虑系统的内部,先画加工的输入和输出,再画加工的内部。即:
(1)识别系统的输入和输出。
(2)从输入端至输出端画数据流和加工,并同时加上文件。
(3)加工的分解“ 由外向里”进行分解。
(4)数据流的命名,名字要确切,能反映整体。
(5)各种符号布置要合理,分布均匀,尽量避免交叉线。
(6)先考虑稳定态,后考虑瞬间态。如系统启动后在正常工作状态,稍后再考虑系统的启动和终止状态。
对于不同的问题,数据流图可以有不同的画法。一般情况下,应该遵守“由外向里”的原则。即先确定系统的边界或范围,再考虑系统的内部,先画加工的输入和输出,再画加工内部。具体实行时可按下述步骤进行:
(1)识别系统的输入和输出,画出顶层图
即确定系统的边界。在系统分析初期,系统的功能需求等还不很明确,为了防止遗漏,不妨先将范围定得大一些。系统边界确定后,那么越过边界的数据流就是系统的输入或输出,将输入与输出用加工符号连接起来,并加上输入数据来源和输出数据去向就形成了顶层图。
(2)画系统内部的数据流、加工与文件,画出一级细化图
从系统输入端到输出端(也可反之),逐步用数据流和加工连接起来,当数据流的组成或值发生变化时,就在该处画一个“加工”符号。
画数据流图时还应同时画上文件,以反映各种数据的存贮处,并表明数据流是流入还是流出文件。
最后,再回过头来检查系统的边界,补上遗漏但有用的输入输出数据流,删去那些没被系统使用的数据流。
(3)加工的进一步分解,画出二级细化图
同样运用“由外向里”方式对每个加工进行分析,如果在该加工内部还有数据流,则可将该加工分成若干个子加工,并用一些数据流把子加工联接起来,即可画出二级细化图。二级细化图可在一级细化图的基础上画出,也可单独画出该加工的二级细化图,二级细化图也称为该加工的子图。
(4)其它注意事项
一般应先给数据流命名,再根据输入/输出数据流名的含义为加工命名。名字含义要确切,要能反映相应的整体。若碰到难以命名的情况,则很可能是分解不恰当造成的。应考虑重新分解。
从左至右画数据流图。通常左侧、右侧分别是数据源和终点,中间是一系列加工和文件。正式的数据流图应尽量避免线条交叉,必要时可用重复的数据源、终点和文件符号。此外,数据流图中各种符号布置要合理,分布应均匀。
画数据流图是一项艰巨的工作,要做好重画的思想准备,重画是为了消除隐患,有必要不断改进。
因为作为顶层加工处理的改变域是确定的,所以改变域的分解是严格的自顶向下分解的。由于目标系统目前还不存在,应此分解时开发人员还需凭经验进行,这是一项创造性的劳动。同时,在建立目标系统数据流图时,还应充分利用本章讲过的各种方法和技术,例如:分解时尽量减少各加工之间的数据流;数据流图中各个成分的命名要恰当;父图与子图间要注意平衡等等。
当画出分层数据流图,并为数据流图中各个成分编写词典条目或加工说明后,就获得了目标系统的初步逻辑模型。