在生成大批量数据之前,首先需要估算软件系统将来使用的业务数据量。
技巧:大数据容量测试的关键是模拟大批量的用户业务数据,因此首先要估算好用户若干年后可能出现的最大数据量。
业务数据量不能凭空估算,最好能与用户一起研究业务的发展情况,充分估计可能出现的业务量和单据量。除了估算业务量,还要看哪些功能操作是比较频繁使用的,哪些功能操作是不常使用的,以便性能测试和调优有重点地进行。
如果某些功能操作是用户经常使用的,那么就要求响应时间要更短些;如果某些功能操作是用户不常用的,例如一些年度统计报表,虽然数据量大,可能导致查询统计的时间比较长,但是因为执行的次数不多,因此即使运行时间比较长也不会对用户造成太大的困扰。
在估算好数据量后,下一步就是用各种手段来模拟生成业务数据量。找出需要进行大数据量性能测试的功能模块,然后分析该功能模块用到了什么数据库表,然后向这些表插入估算的数据量的业务数据,如图9.16所示。

图9.16 向功能模块对应的数据表插入数据
技巧:模拟大批量的数据可以采用一些数据生成工具,例如DataFactory等。也可以自己编写SQL语句插入数据库表或者编写程序产生大批数据。
下面以DataFactory 5.6为例,简单介绍一下用DataFactory生成大批量数据的过程。
(1)首先选择需要插入数据的数据库类型,如图9.17所示。
(2)在这个界面单击“下一步”按钮,出现如图9.18所示的界面。

图9.17 选择数据库类型

图9.18 配置数据库连接
(3)在这个界面中指定数据库连接的账号,单击“下一步”按钮,则出现如图9.19所示的界面。
(4)在这个界面中,选择需要插入数据的表,然后单击“下一步”按钮,则出现如图9.20所示的界面。

图9.19 指定需要插入数据的表