友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!阅读过程发现任何错误请告诉我们,谢谢!! 报告错误
狗狗书籍 返回本书目录 我的书架 我的书签 TXT全本下载 进入书吧 加入书签

SQL语言艺术(PDF格式)-第9章

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!




有检查,支付操作才继续进行。 



为了完成上述功能,不熟练的开发者会写出下列语句,并检查其返回结果: 



   select count(*) 

   from customers 

   where customer_id = provided_id 



接下来,他会做类似的工作,并再一次检查错误代码: 



    select card_num; expiry_date; credit_limit 

    from accounts 

    where customer_id = provided_id 



之后,他才会处理金融交易。 



相反,熟练的开发者更喜欢像下面这样编写代码(假设today()返当前日期): 

  update accounts 

  set balance = balance purchased_amount 

  where balance 》= purchased_amount 

  and credit_limit 》= purchased_amount 

  and expiry_date 》 today() 

  and customer_id = provided_id 

  and card_num = provided_cardnum 

接着,检查被更新的行数。如果结果为 0,只需执行下面的一个操作即可判断出错原因: 

  select c。customer_id; a。card_num; a。expiry_date; 

  a。credit_limit; a。balance 

  from customers c 

  leftouter join accounts a 

  on a。customer_id = c。customer_id 

  and a。card_num = provided_cardnum 

  where c。customer_id = provided_id 



如果此查询没有返回数据,则可断定customer_id 的值是错的;如果 card_num 是 null,则可 

断定卡号是错的;等等。其实,多数情况下此查询无需被执行。 



注意 



你是否注意到,上述第一段代码中使用了count(*)呢?这是个count(*)被误用于存在性检测的绝 


…………………………………………………………Page 28……………………………………………………………

佳例子。 

“进攻式编程”的本质特征是:以合理的可能性(reasonableprobabilities)为基础。例如,检查 

客户是否存在是毫无意义的——因为既然该客户不存在,那么他的记录根本就不在数据库中! 

所以,应该先假设没有事情会出错;但如果出错了,就在出错的地方(而且只在那个地方)采 

取相应措施。有趣的是,这种方法很像一些数据库系统中采用的“乐观并发控制(optimistic 

concurrency control)”,后者会假设update冲突不会发生,只在冲突真的发生时才进行控制处理。 

结果,乐观方法比悲观方法的吞吐量高得多。 



总结:以概论为基础进行编程。假设最可能的结果;不是的确必要,不要采用异常捕捉的处理 

方式。 



            Exceptions 

精明地使用异常(EExxcceeppttiioonnss) 



Discerning Use of Exceptions 



勇敢与鲁莽的界线很模糊,我建议进攻式编程,但并不是要你模仿轻步兵旅在Balaclava的自杀 

性冲锋(注7)。针对异常编程,最终可能落得虚张声势的愚蠢结果,但自负的开发者还是对它“推 

崇备至(go for it)”,并坚信检查和处理异常能使他们完成任务。 



正如其名字所暗示的,异常应该是那些例外情况。对数据库编程的具体情况而言,不是所有异 

常都要求同样的处理方式——这是理解异常的使用是否明智的关键点。有些是“好”异常,应预 

先抛出;有些是“坏”异常,仅当真正的灾害发生时才抛出。 



例如,以主键为条件进行查询时,如果没有结果返回则开销极少,因为只需检查索引即可判断。 

然而,如果查询无法使用索引,就必须搜索整个表——当此表数据量很大,所在机器又正在接 

近满负荷工作时,可能造成灾难。 



有些异常的处理代价高昂,即使是在最佳情况下也不例外,例如重复键(duplicate key)的探 

测。“唯一性(uniqueness)”如何保证呢?我们几乎总是建立一个唯一性索引,每次向该索引增 

加一个键时,都要检查是否违反了该唯一性索引的约束。然而,建立索引项需要记录物理地址, 

于是就要求先将记录插入表,后将索引项插入索引。如果违反此约束,数据库会取消不完全的 

插入,并返回违反约束的错误信息。上述这些操作开销巨大。但最大的问题是,整个处理必须 

围绕个别异常展开,于是我们必须“从个别记录的角度进行思考”,而不是“从数据集出发进行思 

考”,这与关系数据库理论完全背道而驰。多次违反此约束会导致性能严重下降。 



来看一个 Oracle 的例子。假设在两家公司合并后,电子邮件地址定为的标准 

格式,最多 12 个字符,所有空格或引号以下划线代替。 



如果新的employee表已经建好,并包含3 000 条从employee_old表中提取并进行标准化处理的 

电子邮件地址。我们希望每个员工的电子邮件地址具有唯一性,于是Fernando Lopez的地址为 

flopez,而Francisco Lopez的地址为flopez2。实际上,我们实际测试的数据中有33 个潜在的 

重复项,所以我们需要做如下测试: 

  SQL》 insert into employees(emp_num; emp_name; 

  emp_firstname; emp_email) 

  2 select emp_num; 


…………………………………………………………Page 29……………………………………………………………

  3      emp_name; 

  4      emp_firstname; 

  5      substr(substr(EMP_FIRSTNAME; 1; 1) 

  6         ||translate(EMP_NAME; ' '''; '_ _'); 1; 12) 

  7 from employees_old; 



  insert into employees(emp_num; emp_name; emp_firstname; emp_email) 



  * 

  ERROR at line 1: 

  ORA…00001: unique constraint (EMP_EMAIL_UQ) violated 



  Elapsed: 00:00:00。85 



3 000 条数据中重复 33 条,比率大约是 1%,所以,或许可以心安理得地处理符合标准的 

99%,并用异常来处理其余部分。毕竟,1% 的不符标准数据带来的异常处理开销应该不大。 



但这个异常处理的开销到底在哪里呢?让我们先从测试数据中剔除“问题记录”,然后再执行相 

同的测试,比较发现:这次测试的总运行时间,与上次几乎相同,都是18 秒。然而,从测试数 

据中剔除“问题记录”之后再执行前面第一段 insert。。。select 语句时,速度明显比循环快:最终发 

现采用“一次处理一行”的方式导致耗时增加了近 50%。那么,在此例中可以不用“一次处理一 

行”的方式吗?可以,但要首先避免使用异常。正是这个通过异常处理解决“问题记录”问题决定, 

迫使我们采用循序方式的。 



另外,由于发生冲突的电子邮件地址可能不止一个,可以为它们指定某个数字获得唯一性。 



很容易判断有多少个数据记录发生了冲突,增加 一个groupby子句就可以了。但在分配数字时, 

如果不使用主数据库系统提供的分析功能,恐怕比较困难。(Oracle 称为分析功能(analytical 

function), DB2 则称在线分析处理(online analyticalprocessing,OLAP),SQLServer 称之为排 

名功能(ranking function)。)纯粹从SQL角度来看,探索此问题的解决方案很有意义。 



重复的电子邮件地址都可以被赋予一个具唯一性的数字:1赋给年纪最大的员工,2 赋给年纪次 

之的的员工……依次类推。为此,可以编写一个子查询,如果是group中的第一个电子邮件地址 

就不作操作,而该group中的后续电子邮件地址则加上序号。代码如下: 



   SQL》insert into employees(emp_num; emp_firstname; 

   2            emp_name; emp_email) 

   3 select emp_num; 

   4    emp_firstname; 

   5    emp_name; 

   6    decode(rn; 1;emp_email; 

   7           substr(emp_email; 


…………………………………………………………Page 30……………………………………………………………

   8             1;12…length(ltrim(to_char(rn)))) 

   9              ||ltrim(to_char(rn))) 

   10 from (select emp_num; 

   11 
返回目录 上一页 下一页 回到顶部 0 0
未阅读完?加入书签已便下次继续阅读!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!