用Python DB-API开发MySQL脚本-技术开发专区

用Python DB-API开发MySQL脚本

作者：IT168 宇文编辑：覃里 2009-10-15 00:08 来源：IT168�

　　【IT168 技术文档】本文将向读者详细介绍如何利用DB-API模块方便地开发MySQL脚本。我们首先介绍了有关软件的安装方法，随后分别用两个实例对DB-API模块做了深入的介绍，最后讨论了用Python DB-API编写的MySQL脚本的移植注意事项。

　　一、DB-API简介

　　Python语言是一种流行的开源编程语言，不仅自身表达能力强，而且还有许多辅助模块，着极大的增强了其功能。本文介绍的是一个名为DB-API的模块——顾名思义，该模块为开发人员提供了数据库应用编程接口。DB-API旨在帮应用开发人员摆脱特定数据库引擎的具体细节的纠缠，编写出能够在不同数据库引擎之间相互移植的数据库访问脚本。

　　DB-API的设计与Perl和Ruby的DBI模块、PHP 的PEAR DB 类以及Java的JDBC接口非常类似，它使用了一个两层体系结构，其中顶层提供了一个抽象接口，该接口可以泛用于所有支持的数据库引擎;而底层则是有一些特定引擎的驱动程序构成，这些驱动程序负责处理与特定引擎有关的细节。这样的话，为了使用DB-API来编写Python脚本，必须有相应的驱动程序来处理特定的数据库系统。对于MySQL来说，DB-API使用驱动程序MySQLdb来处理对MySQL数据库的访问。下面我们将首先详细介绍驱动程序的安装，然后阐述如何编写DB-API脚本。

　　二、安装MySQLdb

　　为了用DB-API编写MySQL脚本，必须确保已经安装了Python。对于UNIX操作系统来说，通常都安装有该软件，但是Windows系统的话就难说了。其实Python的安装很简单，先到Python官方网站下载安装程序，然后一路回车即可。

　　就本文而言，我们要求使用Python 2.3.4或更高版本，并且还得安装MySQLdb模块。我们可以从命令行提示符(这里的提示符为UNIX操作系统中的%，如果是Windows系统的话，该提示符则为C:\>)中输入下列命令来检查两者的安装情况，命令如下所示：

　　% python

　　Python 2.4.3 (#1, Aug 29 2006, 14:45:33)

　　[GCC 3.4.6 (Gentoo 3.4.6-r1, ssp-3.4.5-1.0, pie-8.7.9)] on linux2

　　Type "help", "copyright", "credits" or "license" for more information.

　　>>> import MySQLdb

　　假如Python的版本满足要求，并且输入import MySQLdb命令(即导入MySQLdb模块)后没有出现错误报告的话，我们就可以开始编写访问数据库的脚本了;但是，如果出现下列错误消息的话，则说明还缺少MySQLdb，所以必须先下载安装MySQLdb模块：

　　>>> import MySQLdb

　　Traceback (most recent call last):

　　File "", line 1, in ?

　　ImportError: No module named MySQLdb

　　为了获得MySQLdb，请访问http://sourceforge.net/projects/mysql-python，从这里可选择适合您的平台的安装包，分为预编译的二进制文件和源代码安装包。如果您选择二进制文件发行版本的话，安装过程基本安装提示即可完成。如果从源代码进行安装的话，则需要切换到MySQLdb发行版本的优异目录，并键入下列命令。在UNIX操作系统之下安装的时候，第二条命令需要以超级用户的身份运行才能将驱动程序文件复制到Python的安装目录中。具体命令如下所示：

　　% python setup.py build

　　% python setup.py install

　　如果安装时遇到问题，您可以阅读MySQLdb发行版本中的自述文件来寻找答案。

　　三、我们第一个DB-API脚本

　　脚本使用MySQLdb的DB-API访问MySQL的时候，通常要经过以下步骤：

　　l 导入MySQLdb模块

　　l 打开一个MySQL服务器连接

　　l 发出查询语句并回收查询结果

　　l 关闭服务器连接

　　下面我们通过一个简单的DB-API脚本对这些步骤进行说明。编写脚本时，可以使用文本编辑程序建立一个文件，将其命名为server_version.py，然后用它来存放下面的脚本。这个脚本利用MySQLdb实现与MySQL服务器的交互，它的任务很简单，那就是询问服务器的版本字符串：

　　# server_version.py - 检索并显示数据库服务器版本

　　import MySQLdb

　　conn = MySQLdb.connect (host = "localhost",

　　user = "testuser",

　　passwd = "testpass",

　　db = "test")

　　cursor = conn.cursor ()

　　cursor.execute ("SELECT VERSION()")

　　row = cursor.fetchone ()

　　print "server version:", row[0]

　　cursor.close ()

　　conn.close ()

　　Import语句告诉Python该脚本需要MySQLdb模块中的代码。注意，导入语句必须放置在连接MySQL服务器的语句之前。然后，使用相应连接参数来调用MySQLdb驱动程序的connect()方法，这些参数包括运行MySQL的服务器的主机名，我们MySQL帐户对应的用户名和口令，以及我们要使用的数据库的名称。Connect()的参数语法会随着驱动程序的不同而不同，对于MySQLdb来说，这些参数可以通过name = value的格式提供，这样的话，我们就可以不同的顺序来提供参数。server_version.py会在本地主机上建立一个到达MySQL服务器的连接，并利用用户名和口令即testuser和testpass来访问我们的数据库test，如下所示：

　　conn = MySQLdb.connect (host = "localhost",

　　user = "testuser",

　　passwd = "testpass",

　　db = "test")

　　如果调用connect()成功，它会返回一个连接对象，为进一步与MySQL交互做好准备。如果调用失败，它会抛出一个异常。注意，我们的server_version.py脚步并没有处理该异常，所以碰到错误时该脚本就会终止。具体的错误处理将在后面加以介绍。

　　获得连接对象之后，server_version.py会调用该对象的cursor()方法来创建一个游标对象来处理语句。该脚本利用这个游标发送一个SELECT VERSION()语句，该语句会返回一个包含有服务器版本信息的字符串，如下所示：

　　cursor = conn.cursor ()

　　cursor.execute ("SELECT VERSION()")

　　row = cursor.fetchone ()

　　print "server version:", row[0]

　　cursor.close ()

　　该游标对象的execute()方法能将向服务器发送语句，而fetchone()方法则检索回一行数据，该数据作为元组处理。对于这里的语句，该元组包含一个单一的值，这个值将被该脚本打印出来。如果无法取得数据行，fetchone()将返回None值;这种情况的处理我们将在后面加以介绍。游标对象可用于发出多个语句，但是server_version.py获取版本字符串之后就不再需要该游标了，所以我们将其关闭即可。

　　最后，该脚本调用连接对象的close()方法关闭到服务器的连接，如下所示：

　　conn.close ()

　　之后，conn将被废弃，所以就无法再使用它来访问服务器了。

　　若要执行server_version.py脚本，可以从命令行调用Python，并给出该脚本的名称即可。之后，我们将看到类似如下所示的输出：

　　% python server_version.py

　　server version: 5.1.12-log

　　这表明该MySQL服务器的版本是5.1.12;后缀-log说明查询日志记录功能已被启用。当然，实际上您可能会看到其他后缀，这要视您使用的数据库服务器而定。举例来说，后缀-beta表示该发行版本的稳定级别;如果您启用了调试功能，您就会在运行结果中看到-debug后缀。

　　所以可以建立脚本，这样可以通过其名称来运行之，而无需显式调用Python。在UNIX操作系统之下，可以为脚本开头部分添加一个#!行，用以规定Python解释器的完整路径。这样的话，系统就知道应使用哪个程序来执行此脚本。举例来说，如果Python解释器位于/usr/bin/python，那么可在脚本的第一行添加如下所示的内容：

　　#!/usr/bin/python

　　然后，使用chmod把该脚本变成可执行文件，这样我们就能通过下列命令来直接运行脚本：

　　% chmod +x server_version.py

　　% ./server_version.py

　　其中，先导的./的作用是显式告诉命令解释程序：该脚本位于当前目录中，这样做是因为许多UNIX操作系统的帐户没有配置成在当前目录搜索命令。

　　在Windows操作系统中，无需#!行开头，不过即使加了这一行也没有关系，所以如果要把运行在UNIX系统的脚本移植到Windows系统的时候，无需对它进行修改。不过，与使用chmod将.py脚本变为可执行文件不同，我们需要把以.py结尾的文件与Python关联在一起，为此，可以在控制面板中打开“工具”菜单下的“文件夹选项”，单击文件类型选项卡，在此，将以.py作为扩展名的文件设置成使用Python打开。这样一来，我们就可以通过脚本的名称来调用它了，如下所示：

　　C:\> server_version.py

　　如果在 Windows 上安装的是ActiveState Python，那么ActiveState的安装程序会在安装过程中自动完成此关联过程。

　　四、更复杂的DB-API脚本

　　前面的示例脚本Server_version.py有许多缺点，比如，它没有捕捉异常，也不能在出错时指出到底是什么样的错误，此外，它也不允许执行语句时不返回任何结果。下面通过一个更加“高级”的脚本animal.py来演示如何解决这些问题，这里给出完整的animal.py代码。

　　#animal.py：创建动物表并从中检索信息

　　import sys

　　import MySQLdb

　　#连接到MySQL服务器

　　try:

　　conn = MySQLdb.connect (host = "localhost",

　　user = "testuser",

　　passwd = "testpass",

　　db = "test")

　　except MySQLdb.Error, e:

　　print "Error %d: %s" % (e.args[0], e.args[1])

　　sys.exit (1)

　　#创建动物表并填充内容

　　try:

　　cursor = conn.cursor ()

　　cursor.execute ("DROP TABLE IF EXISTS animal")

　　cursor.execute ("""

　　CREATE TABLE animal

　　(

　　name CHAR(40),

　　category CHAR(40)

　　)

　　""")

　　cursor.execute ("""

　　INSERT INTO animal (name, category)

　　VALUES

　　('snake', 'reptile'),

　　('frog', 'amphibian'),

　　('tuna', 'fish'),

　　('racoon', 'mammal')

　　""")

　　print "Number of rows inserted: %d" % cursor.rowcount

　　#使用fetchone()进行循环提取

　　cursor.execute ("SELECT name, category FROM animal")

　　while (1):

　　row = cursor.fetchone ()

　　if row == None:

　　break

　　print "%s, %s" % (row[0], row[1])

　　print "Number of rows returned: %d" % cursor.rowcount

　　#使用fetchall()进行循环提取

　　cursor.execute ("SELECT name, category FROM animal")

　　rows = cursor.fetchall ()

　　for row in rows:

　　print "%s, %s" % (row[0], row[1])

　　print "Number of rows returned: %d" % cursor.rowcount

　　#发出修改名称的语句，共两种方式，第一种是在语句字符串

　　#中使用数据值的字面值，第二种是使用位置标识符

　　cursor.execute ("""

　　UPDATE animal SET name = 'turtle'

　　WHERE name = 'snake'

　　""")

　　print "Number of rows updated: %d" % cursor.rowcount

　　cursor.execute ("""

　　UPDATE animal SET name = %s

　　WHERE name = %s

　　""", ("snake", "turtle"))

　　print "Number of rows updated: %d" % cursor.rowcount

　　#创建一个字典游标，这样就可以使用位置而非名称来访问数据列中的值了。

　　cursor.close ()

　　cursor = conn.cursor (MySQLdb.cursors.DictCursor)

　　cursor.execute ("SELECT name, category FROM animal")

　　result_set = cursor.fetchall ()

　　for row in result_set:

　　print "%s, %s" % (row["name"], row["category"])

　　print "Number of rows returned: %d" % cursor.rowcount

　　cursor.close ()

　　except MySQLdb.Error, e:

　　print "Error %d: %s" % (e.args[0], e.args[1])

　　sys.exit (1)

　　conn.commit ()

　　conn.close ()

　　该脚本使用一个表来存储动物的名称和类别：

　　CREATE TABLE animal

　　(

　　name CHAR(40),

　　category CHAR(40)

　　)

　　本例中的表和一些语句取自于PEAR DB的说明文档。脚本animal.py的开头部分如下所示，从#!行可以看出它是打算运行于UNIX系统的：

　　#!/usr/bin/python

　　# animal.py - 创建动物表并从中检索信息

　　import sys

　　import MySQLdb

　　如同Server_version.py一样，这个脚本也导入了MySQLdb，此外，它还导入了sys模块以供错误处理之用。如果发生错误，animal.py就会利用sys.exit()返回1来表明脚本异常结束。

　　下面介绍错误处理。导入必要的模块之后，animal.py使用connect()调用建立到服务器的连接。为了处理连接故障，比如，显示故障的原因，该脚本必须捕捉异常。在Python语言中，为了处理异常，必须把代码放到try语句中，并且包括一个except子句来包含错误处理代码。生成的连接的代码如下所示：

　　try:

　　conn = MySQLdb.connect (host = "localhost",

　　user = "testuser",

　　passwd = "testpass",

　　db = "test")

　　except MySQLdb.Error, e:

　　print "Error %d: %s" % (e.args[0], e.args[1])

　　sys.exit (1)

　　Except子句中的异常类MySQLdb.Error用于取得MySQLdb可以提供的具体数据库错误信息，而变量e则用来存放错误信息。如果出现异常，MySQLdb会把有关信息存入e.args——这是一个包含错误代码和描述该错误的字符串组成的双元素元组。在本例中，except子句会打印这些值，然后退出。

　　任何数据库有关的语句都可以放入类似的try/except结构中来收集和报告错误，为了简便起见，后面的讨论中不再显示异常处理代码。

　　接下来介绍用于发送语句的方法。Animal.py接下来的代码将创建一个游标对象，并利用它发送设置和填充动物表的语句。这部分代码如下所示：

　　cursor = conn.cursor ()

　　cursor.execute ("DROP TABLE IF EXISTS animal")

　　cursor.execute ("""

　　CREATE TABLE animal

　　(

　　name CHAR(40),

　　category CHAR(40)

　　)

　　""")

　　cursor.execute ("""

　　INSERT INTO animal (name, category)

　　VALUES

　　('snake', 'reptile'),

　　('frog', 'amphibian'),

　　('tuna', 'fish'),

　　('racoon', 'mammal')

　　""")

　　print "Number of rows inserted: %d" % cursor.rowcount

　　需要注意的是，这里的代码没有包含错误检查。请记住，它们可以放入try语句，这样一旦出错就会触发异常，继而被except子句所捕获并处理。但是考虑到代码的可读性，我们这里只给出了代码的主干部分。上面的语句将完成以下动作：

　　l 动物表已经存在，则丢弃它。

　　l 创建动物表。

　　l 向表中插入一些数据，并报告添加的行数。

　　这些语句都是通过调用游标对象的execute()方法发出的。其中前两个execute()语句不会生成数据，但是第三个语句将生成一个表示已经插入行数的统计量。这个统计数字存放在游标的rowcount属性中。有些数据库接口是通过execution运行调用的返回值来提供这个统计数字的，但是DB-API却不是这样。

　　此动物表已经建好，所以我们可以发出选择指令来从中检索信息了。如同前面的语句一样，SELECT语句也要使用execute()方法发出。然而，与DROP或者INSERT语句不同的是，SELECT语句会生成一个结果集合，也就是说，execute()仅仅发出语句，但是却没有返回结果集合。我们可以使用fetchone()方法每次返回一行数据，或者使用fetchall()方法一次全部搞定。在animal.py中，这两者方法都用到了。下面是如何使用fetchone()每次检索一行数据的方法：

　　cursor.execute ("SELECT name, category FROM animal")

　　while (1):

　　row = cursor.fetchone ()

　　if row == None:

　　break

　　print "%s, %s" % (row[0], row[1])

　　print "Number of rows returned: %d" % cursor.rowcount

　　方法fetchone()会把结果集合的下一行作为一个元组返回，如果已经到了结果集合的末尾的话，就返回值None。这里的循环会进行相应的检查，并在取尽结果集合的时候退出。对于返回的每一行，元组包含了两个值，Print语句会打印输出每个元组元素。然而，因为它们是安装在元组中的顺序使用的，所以Print语句正好可以如下编写：

　　print "%s, %s" % row

　　显示此语句结果之后，脚本还会显示返回的行数，即rowcount属性的值。

　　Fetchall()可以把整个结果集合作为以元组为元素的元组一次返回，或者，如果结果集合为空则会返回一个空的元组。为了访问个别数据行，可以枚举fetchall()返回的行集合，具体代码如下所示：

　　cursor.execute ("SELECT name, category FROM animal")

　　rows = cursor.fetchall ()

　　for row in rows:

　　print "%s, %s" % (row[0], row[1])

　　print "Number of rows returned: %d" % cursor.rowcount

　　上面通过访问rowcount来打印行数。当fetchall()的时候，另一种确定行数的方法是使用它返回的值的长度，如下所示：

print "%d rows were returned" % len (rows)

　　前面的循环语句中是把数据行作为元组看待的，如果我们将其作为字典处理的话，就可以通过名字来访问各列的值了。以下代码展示了这一过程。需要注意的是，访问字典需要一种不同的游标，所以这里关闭了原来的游标，并利用一个不同的游标类获得了一个新游标，如下所示：

print "%d rows were returned" % len (rows)

　　结果集合中的空值将作为None返回。MySQLdb支持位置标识符功能，利用它可以在语句字符串之内为数据值绑定特殊标记。这就为直接向语句中嵌入值提供了替代方法。位置标识符机制会给数据值添加引号，并逸出出现在这些值内的所有的特殊字符。下面的示例演示了一个把蛇改成海龟的UPDATE语句，首先使用的是字面值，然后使用的是位置标识符。其中使用字面值的语句看上去是这样的：

　　cursor.execute ("""

　　UPDATE animal SET name = 'turtle'

　　WHERE name = 'snake'

　　""")

　　print "Number of rows updated: %d" % cursor.rowcount

　　另外，我们还可以使用位置标识符标记%s，并为其捆绑相应的值的方式来发送这个语句，代码如下所示：

　　cursor.execute ("""

　　UPDATE animal SET name = %s

　　WHERE name = %s

　　""", ("snake", "turtle"))

　　print "Number of rows updated: %d" % cursor.rowcount

　　这里是上面的execute()调用方式的注意事项：

　　l 每个位置标识符%s对应于一个插入该语句字符串的值。

　　l 指示符%s不应该用引号括住，MySQLdb会根据需要添加引号。

　　l 绑定给位置标识符的值放在一个元组中，它们在元组中的顺序就是出现在语句中的顺序。如果只有一个值x的话，可以写作(x,)，表示这是个单元素元组。

　　l 可以给位置标识符绑定一个None值，这表示向该语句中插入一个SQL空值。

　　发出有关语句之后，animal.py将关闭此游标，确认修改，并断开跟服务器的连接，如下所示：

　　cursor.execute ("""

　　UPDATE animal SET name = %s

　　WHERE name = %s

　　""", ("snake", "turtle"))

　　print "Number of rows updated: %d" % cursor.rowcount

　　连接对象的commit()方法确保当前事务中的修改已经在数据库中完成。在DB-API中，autocommit模式被禁用了，所以在断开连接之前必须调用commit()，否则所作修改可能会丢失。

　　如果动物表是一个MyISAM表，commit()就不起作用了：MyISAM是一种非事务性存储引擎，所以对MyISAM表的修改会立即生效，与autocommit模式无关。如果使用了事务性存储引擎，当断开连接的时候如果不调用commit()会导致一个隐式的事务回滚。举例来说，如果我们在CREATE TABLE语句后面加上ENGINE = InnoDB，并删除脚本末尾处的commit()调用，就会发现脚本运行后animal为空。

　　对于仅仅检索数据的脚本，由于不用对修改进行确认，所以commit()对它们来说也是不需要的。

　　五、关于移植事项

　　如果希望把基于MySQLdb的DB-API脚本移植到不同的数据库，则要需要修改的地方主要是出现驱动程序名称的地方：

　　1. 用于导入驱动模块的import语句，必须进行修改以便导入相应的驱动程序。

　　2. 连接数据库服务器的connect()调用。此connect()方法是通过驱动模块的名称进行访问的，所以驱动程序名称需要更改。此外，connect()参数语法也会随着驱动程序的不同而变化。

　　3. 异常处理。在except子句中的异常类也是通过驱动程序名称引用的，所以也要根据需要进行相应的修改。

　　进行移植时，除了驱动程序名称之外还有一些地方要注意，那就是位置标识符。DB-API规范允许使用某些位置标识符语法，但是一些驱动程序使用的语法确不同于MySQLdb支持的语法。

　　六、小结

　　本文向读者详细介绍如何利用DB-API模块方便地开发MySQL脚本。我们首先介绍了有关软件的安装方法，随后分别用两个实例对DB-API模块做了深入的介绍，最后讨论了用Python DB-API编写的MySQL脚本的移植注意事项。希望本文能够对您有所帮助。

关注我们