李紅麗
SQL Server數(shù)據(jù)庫的查詢優(yōu)化探析
李紅麗
SQL Server是一個關(guān)系數(shù)據(jù)庫系統(tǒng),是一個全面的數(shù)據(jù)庫管理平臺,查詢語句是數(shù)據(jù)庫中最基本、最常用、最復雜的語句,數(shù)據(jù)庫中的查詢在返回結(jié)果時有時需要很長的時間,速度非常緩慢導致用戶無法忍受。為提高查詢效率,數(shù)據(jù)庫的查詢優(yōu)化便成了一個備受關(guān)注的話題。從SQL Server數(shù)據(jù)庫出發(fā),結(jié)合數(shù)據(jù)庫中的查詢語句,可以討論影響SQL Server數(shù)據(jù)庫查詢效率的因素,并提出SQLServer數(shù)據(jù)庫優(yōu)化查詢的方法。
SQLServer;數(shù)據(jù)庫;查詢效率;查詢優(yōu)化
李紅麗/陽泉師范高等??茖W校助教(山西陽泉045200)。
隨著計算機科學技術(shù)日新月異的發(fā)展,數(shù)據(jù)庫技術(shù)成了其中發(fā)展較快的領(lǐng)域之一,SQL Server已成為最普及、最全能的數(shù)據(jù)庫管理系統(tǒng),因此各類信息管理系統(tǒng)與數(shù)據(jù)庫有了更緊密的結(jié)合。隨著數(shù)據(jù)量的不斷增加,數(shù)據(jù)查詢的速度受到了嚴重影響,數(shù)據(jù)庫的合理使用便顯得尤為重要。因此,本文對數(shù)據(jù)庫系統(tǒng)的查詢優(yōu)化展開討論。
在SQL Server數(shù)據(jù)庫中,對于一個查詢而言,經(jīng)常會遇到查詢方法不同但查詢結(jié)果相同的情況,但條件表達式不同會使數(shù)據(jù)庫的響應速度出現(xiàn)很大差別。以下面兩條常用SQL語句為例:
Select*from table where TID>1000 and name=’LiYang’;
和 Select*from tablewhere name=’LiYang’and TID>1000;
從這兩條語句的書寫順序來看它們不太一樣,如果TID是一個聚合索引,那么第一條語句查詢時,直接從表的1000條之后的記錄中查找滿足name='LiYang'的記錄;而第二條語句查詢時,需先從全表中查找出滿足name='LiYang'的所有記錄,然后再根據(jù)TID>1000這個限制條件提取出查詢結(jié)果??梢?,第一條語句的查詢速度要快。
在設(shè)計數(shù)據(jù)庫查詢時,查詢效率顯得至關(guān)重要。在設(shè)計中應注意到:(1)是否用到索引。數(shù)據(jù)庫索引如同書籍中的目錄,在訪問數(shù)據(jù)庫時,用戶可以減少遍歷數(shù)據(jù)的次數(shù),從而可以快速找到所需數(shù)據(jù)。(2)I/O吞吐量。在硬件環(huán)境特定時,部署方案的優(yōu)化可適當提高I/O吞吐量,避免發(fā)生瓶頸問題。(3)應當創(chuàng)建計算列。如果沒有相應的計算列,在進行數(shù)據(jù)查詢時對已有數(shù)據(jù)再次進行計算,從而浪費一部分性能。(4)要有足夠的內(nèi)存。在查詢或訪問數(shù)據(jù)庫中的數(shù)據(jù)時,難免會占用大量的內(nèi)存空間,當內(nèi)存不足時,數(shù)據(jù)的訪問速度就會受到明顯的影響。除此以外,網(wǎng)速慢、查詢出的數(shù)據(jù)量過大、鎖或者死鎖、返回了不必要的行和列、查詢語句不夠優(yōu)化等,也是影響SQL Server數(shù)據(jù)庫查詢效率的重要因素。
索引查詢是數(shù)據(jù)庫中重要的記錄查詢方法,它的根本目的就是為了加快查詢速度。以下是實際應用中應該注意的幾點。
3.1.1 連接操作需要經(jīng)常進行,但是沒有指定為外鍵的列上建立索引,而連接操作不經(jīng)常進行的字段優(yōu)化器會自動生成索引;特別注意不要在選擇的欄位上使用索引,這樣是無意義的,最好在條件選擇的語句上合理的使用索引。如where,order by。
舉例:Select id,title,content,cat_id from article where cat_id=11;
這個語句在id,title,content上使用索引是毫無意義的,對這個語句沒有任何優(yōu)化作用。但如果在外鍵cat_id上使用索引,可以起到優(yōu)化作用。
3.1.2 在SQL語句中GROUP BY、ORDER BY的字段上經(jīng)常建立索引。
3.1.3 在條件表達式中用到的不同值較多的列上最好建立檢索,在不同值較少的列上不需要建立索引,如性別字段上就不必建立索引。
3.1.4 經(jīng)常存取的列應避免建立索引。
3.1.5 如果某些列需要建立連接應該建立索引。
3.1.6 如果有多個待排序的列,可在這些列上建立復合索引(compound index),但注意建立復合索引的順序要按照使用的頻度來確定。
3.1.7 在缺省情況下要建立非簇集索引,但有時也要考慮簇集索引,如:含有有限數(shù)目(不是很少)唯一的列,進行大范圍的查詢。
索引的充分利用可減少I/0的掃描次數(shù),有效避免對整個表的搜索。當然索引的合理性要建立在對各種查詢的分析和預測中,也取決于DBA所設(shè)計的數(shù)據(jù)庫結(jié)構(gòu)。
在數(shù)據(jù)庫查詢時應避免或簡化對大型表的重復排序。在可以利用索引自動以適當?shù)拇涡蜻M行輸出時,優(yōu)化器可自動避免排序的步驟。為避免多余的排序,要適當?shù)脑鰷p索引,適當?shù)睾喜?shù)據(jù)庫表。如果實在避免不了排序,要考慮適當簡化。
在使用嵌套查詢時,對表的順序掃描會使查詢效率明顯下降。為避免這種情況,可以對連接的列進行索引。如有三個表:學生表Studen(t學號Sno、姓名Sname、性別Sex、年齡Sage、系別Sdept),課程表Course(課程號Cno,課程名Cname,先行課Cpno,學分Ccredit)和選課表SC(學號Sno、課程號Cno、成績Score)。如果其中兩個表要做連接,就要在“學號”這個連接字段上建立索引。
此外,也可使用并集來避免順序存取。雖然在所有的列上都有索引,但某些形式的where子句迫使優(yōu)化器使用順序存取。以下例子是強迫對orders表執(zhí)行順序操作:
在Student.sno和SC.sno上雖建立了索引,但在這個語句中優(yōu)化器還會使用順序存取路徑掃描整張表。因為這個語句檢索的是分離的行的集合,所以應改為如下語句:
此時就可以利用索引路徑處理查詢,提高查詢效率。
如果一個列的標簽在主查詢和where子句中的查詢中同時出現(xiàn),那么當主查詢中的列值改變后,很可能子查詢必須重新查詢一次。查詢嵌套的層次越多,效率就會越低,因此要盡量避免子查詢。若子查詢不可避免,就要在子查詢中將多余的行全部過濾掉。
在數(shù)據(jù)庫查詢中使用通配符匹配時特別耗費時間。如以Student表為例看like關(guān)鍵字:
在執(zhí)行查詢時就會利用索引來查詢,顯然會大大提高速度。
除以上優(yōu)化方法之外,還應注意:(1)要避免在經(jīng)常被更新的列上建立索引。因為每次更新操作,所有的索引都要做相應的調(diào)整。另外,所有的分頁操作都被記錄在日志中,這樣也會增加I/O操作。(2)要避免在經(jīng)常更新的列上建立聚集索引,以免引起整行的移動。(3)要盡量在where子句中少用OR和IN??梢钥紤]將其使用Union分成幾個子查詢。(4)應避免在where子句中使用NOT、<>、或!=運算符,減少全表掃描。
SQLServer是微軟公司出品的關(guān)系型數(shù)據(jù)庫管理(RDBMS)軟件,雖應用很廣,效率很高,但在實際應用過程中,隨著數(shù)據(jù)庫規(guī)模越來越大,數(shù)據(jù)量呈指數(shù)級上升,應進一步完善提升,從而繼續(xù)改善數(shù)據(jù)庫(尤其是大型數(shù)據(jù)庫)的性能。
[1]石樹剛.關(guān)系數(shù)據(jù)庫[M].北京:清華大學出版社,1998
[2王珊,薩師煊.數(shù)據(jù)庫系統(tǒng)概論[M].北京:高等教育出版社,2006
[3]付立平,青巴圖,郎彥.數(shù)據(jù)庫原理與應用[M].北京:高等教育出版社,2004
[4]陳佳.基于SQL server數(shù)據(jù)庫優(yōu)化查詢的分析 [J].企業(yè)導報,2010,8:179-181
[5]谷震離.SQL Server數(shù)據(jù)庫應用程序性能優(yōu)化方法[J].計算機工程與設(shè)計,2006,27(15)
G202
A
1671-6531(2013)07-0054-01
郭一鶴