Java程序员在写SQL时候常犯的10个错误-技术开发专区

Java程序员在写SQL时候常犯的10个错误

作者：oschina译者编辑：王晓东 2013-08-06 11:10 来源：开源中国社区

　　4.通过JDBC分页技术给大量的结果进行分页操作

　　大部分的数据库都会支持一些分页命令实现分页效果，譬如LIMIT..OFFSET,TOP..START AT,OFFSET..FETCH语句等。即使没有支持这些语句的数据库，仍有可能对ROWNUM(甲骨文)或者是ROW NUMBER() OVER()过滤(DB2,SQL Server2008等)，这些比在内存中实现分页更快速。在处理大量数据中，效果尤其明显。

　　纠正：

　　仅仅使用这些语句，那么一个工具(例如JOOQ)就可以模拟这些语句的操作。

　　5.在java内存中加入数据

　　从SQL的初期开始，当在SQL中使用JOIN语句时，一些开发者仍旧有不安的感觉。这是源自对加入JOIN后会变慢的固有恐惧。假如基于成本的优化选择去实现嵌套循环，在创建一张连接表源前，可能加载所有的表在数据库内存中，这可能是真的。但是这事发生的概率太低了。通过合适的预测，约束和索引，合并连接和哈希连接的操作都是相当的快。这完全是是关于正确元数据(在这里我不能够引用Tom Kyte的太多)。而且，可能仍然有不少的Java开发人员加载两张表通过分开查询到一个映射中，并且在某种程度上把他们加到了内存当中。

　　纠正：

　　假如你在各个步骤中有从各种表的查询操作，好好想想是否可以表达你的查询操作在单条语句中。

　　6.在一个临时的笛卡尔积集合中使用 DISTINCT 或 UNION 消除重复项

　　通过复杂的连接，人们可能会对SQL语句中扮演关键角色的所有关系失去概念。特别的，如果这涉及到多列外键关系的话，很有可能会忘记在JOIN .. ON子句中增加相关的判断。这会导致重复的记录，但或许只是在特殊的情况下。有些开发者因此可能选择DISTINCT来消除这些重复记录。从三个方面来说这是错误的：

　　• 它(也许)解决了表面症状但并没有解决问题。它也有可能无法解决极端情况下的症状。

　　• 对具有很多列的庞大的结果集合来说它很慢。DISTINCT要执行ORDER BY操作来消除重复。

　　• 对庞大的笛卡尔积集合来说它很慢，还是需要加载很多的数据到内存中。

　　解决方法:

　　根据经验，如果你获得了不需要的重复记录，还是检查你的JOIN判断吧。可能在某个地方有一个很难觉察的笛卡尔积集合。

　　7. 不使用MERGE语句

　　这并不是一个过失，但是可能是缺少知识或者对于强悍的MERGE语句信心不足。一些数据库理解其它形式的更新插入(UPSERT)语句，如 MYSQL的重复主键更新语句，但是MERGE在数据库中确是很强大，很重要，以至于大肆扩展SQL标准，例如SQL SERVER。

　　解决之道:

　　如果你使用像联合INSERT和UPDATE或者联合SELECT .. FOR UPDATE然后在INSERT或UPDATE等更新插入时，请三思。你完全可以使用一个更简单的MERGE语句来远离冒险竞争条件。

　　8. 使用聚合函数代替窗口函数(window functions)

　　在介绍窗口函数之前，在SQL中聚合数据意味着使用GROUP BY语句与聚合函数相映射。在很多情形下都工作得很好，如聚合数据需要浓缩常规数据，那么就在join子查询中使用group查询。

第1页：在Java内存中处理数据第2页：在java内存中加入数据第3页：使用内存间接排序

关注我们