基于SQLServer2008的SQL调优
1. 前言SQL是程序设计人员与数据库进行沟通的标准语言,在数据库应用程序中,使用最多的访问数据库的方法就是SQL语言。SQL性能的调整涉及到SQLServer 2008的方方面面,优化器的选择、内存参数的设定、SQL语句的写法等。本文主要从SQL语句的优化方面进行阐述,给出了一些可行的调整数据库应用性能的策略与方法,并以SQLServer 2008为平台对列举规则给予了验证。2. 实验环境
本实验是在SQL Server Management Studio平台上执行的。且运行时均利用 DBCC FREEPROCCACHE? DBCCDROPCLEANBUFFERS? DBCC FREESYSTEMCACHE ('ALL' )这三条语句清理了缓冲区,从而得出相对公平的执行时间。 另外,每段实验代码均放入如下代码中间执行,这样可以得到SQL语句执行所用的时间,获取执行时间的代码如下: declare @begin_date datetime declare @end_date datetime select @begin_date = getdate() <实验SQL语句写在此处> select @end_date = getdate() select datediff(ms,@begin_date,@end_date) as '用时/毫秒' 3. SQL调优3.1 优化SELECT语句如果查询数据时涉及多个表,则通常需要使用连接查询。SQL Server 2008支持内连接、外连接和交叉连接等连接查询方式。3.1.1 连接查询的优化子查询替换连接表 低效语句: select c.cardno,cc.IDCard,c.amount,c.consumedate from CreditCard cc left join Consume c on cc.Cardno = c.Cardno where c.Cardno = '9555xxxxxxx1' 高效语句: select @begin_date = getdate() select c.cardno,c.consumedate from (select * from CreditCard where Cardno = '9555xxxxxxx1') ccleft join Consume c on cc.Cardno = c.Cardno执行结果分别如下: 3.1.2控制查询的行和列优化SELECT语句,首先需要考虑的是减少返回结果集中的数据量。在SELECT语句中,应该尽量可能不返回多余的数据,这需要从行和列两方面进行优化。 减少结果集中列的数量: 低效语句: select * from CreditCard cc left joinConsume c on cc.Cardno = c.Cardno where c.Cardno = '9555xxxxxxx1' 高效语句: select @begin_date = getdate() selectc.cardno,c.consumedate from CreditCard cc left join Consume c on cc.Cardno = c.Cardno where c.Cardno = '9555xxxxxxx1'执行结果分别如下: 3.1.3 慎用DISTINCT关键字DISTINCT关键字一般用来于字段很少的表,如果在SELECT语句中查询的字段很多,则使用DISTINCI关键字反而会大大降低查询的效率。 低效语句(使用DISTINCT): select distinctc.cardno,cc.OwnerName,s.shopname,g.goodsname,c.consumedate from Consume c inner join CreditCard cc on cc.Cardno = c.Cardno inner join Shop s on c.ShopId=s.ShopId inner join Goods g onc.GoodsId=g.GoodsId 高效语句(不使用DISTINCT): selectc.cardno,c.consumedate from Consume c inner join CreditCard cc on cc.Cardno = c.Cardno inner join Shop s on c.ShopId=s.ShopId inner join Goods g onc.GoodsId=g.GoodsId执行结果分别如下: 3.1.4 判断表中是否存在记录有些人喜欢使用COUNT(*)来判断表中是否存在记录,例如 select count(*) from consume 这种方法要统计表中所有记录的总数量,因此执行效率比较低。可以在select语句中使用TOP1返回表中的第一条记录来判断表是否存在记录: 低效语句: select COUNT(*) from Consume 高效语句: select top 1 ConsumeID from Consume执行结果分别如下: 3.2 对大批量插入、修改和删除数据操作的优化3.2.1 使用SQL脚本模拟实时批量插入数据-- 使用Credit数据库 USE Credit GO -- 创建临时表#test CREATE TABLE #test ( id int,name varchar(100),createdate datetime,) GO DECLARE @i as INT declare @strsql as varchar(8000) SET @i = 0 -- 循环插入10万条记录 WHILE @i < 100000 BEGIN SET @strsql = 'INSERT INTO #test VALUES(' + convert(varchar(100),@i) + ',''test'',''' + convert(varchar(50),getdate()) + ''')' --VALUES(@i,'test',getdate()) exec(@strsql) SET @i = @i + 1 END从下面两张图我们可以看出,计算机的CUP使用率一直居高不下看,这样会严重影响系统性能,导致用户无法正常使用数据库应用程序。 下面我们对批量插入数据进行优化,可以使用WAITFOR DELAY语句进行休息,例如,让数据库引擎休息100ms的代码如下: WQITFOR DELAY ’00:00:00:100’优化后的SQL脚本如下: -- 使用Credit数据库 USE Credit GO -- 创建临时表#test CREATE TABLE #test ( id int,getdate()) exec(@strsql) WAITFOR DELAY '00:00:00:20' SET @i = @i + 1 END执行此脚本,我们再来查看CUP的使用情况: CPU的占用率已经降到5%左右,虽然执行的时间增加了,但是这完全满足系统正常运行的需要。 3.2.2 优化修改和删除语句如果一条UPDATE语句或者DELETE语句设计的记录过多,则执行语句的时间会很长,在执行语句的过程中,数据库服务器的CPU利用率会很高,从而影响其他用户对数据库的访问效率。当对大量数据进行更新和删除操作时,可以根据用户的具体情况来决定操作的方式。 a)如果在非工作时间执行大量更新或者删除操作,则应该尽可能地在一条语句中更新更多的记录,这是最快的操作方式。 b)如果在工作时间执行大量更行或删除操作,则应该根据实际情况将UPDATE语句或者DELETE语句拆分成多条语句,每执行一条语句休息一段时间。 下面做一个对比实验,执行下面的UPDATE语句,将表Consume中所有记录的Amount数量增加10%。 update Consume set Amount = Amount * 1.1 whereConsumeID>0执行结果如下: CPU的使用率一直维持在60%左右: 如果希望在执行更新操作时尽可能降低数据库服务器的CPU使用率,不影响其他用户对数据库的访问,可以使用下面的SQL语句: update Consume set Amount = Amount*1.1where Amount<200 waitfor delay '00:00:00:100' update Consume set Amount = Amount*1.1where Amount>=200 and Amount<500 waitfor delay '00:00:00:100' update Consume set Amount = Amount*1.1where Amount>=1000 and Amount<2000 update Consume set Amount = Amount*1.1where Amount>2000 waitfor delay '00:00:00:100'从下图的数据可知,CPU的占用率与前面的比较降低了不少。 4. 总结在SQL Server 2008中性能的优化还有许多方面,如存储引擎优化、处理器管理优化、视图的优化等等。以上实验只是针对SQL Server 2008中的SQL语句进行调优。本文中的实验所测得的SQL执行时间会有微小误差,这是不能避免的。更进一步的数据库优化操作有待于进一步的学习和总结。(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |