提高SQL查詢效能的7個方法?

Tags: 問題, 資料庫, 效能, 開發人員,

每個資料庫平臺上的SQL開發人員都是在困難中求得生存，我們總是一次又一次犯同樣的錯誤，這是因為資料庫領域還相對不成熟，是的，每個資料庫廠商都在做著各種不同的努力，但作為開發人員仍然要克服各種問題，無論是在SQL Server，Oracle，DB2，Sybase，MySQL資料庫，還是其它關係資料庫平臺上編寫SQL程式碼，併發性、資源管理、空間管理和SQL執行速度總是困擾著開發人員。遺憾的是，其中部分問題的解決沒有靈丹妙藥，也幾乎沒有最佳實踐。通常，開發人員有自己喜歡的SQL書寫習慣，一般不願意去研究其它可行方案，當然這可能是因為缺少培訓的原因。我見得最多的就是在測試環境中SQL查詢執行良好，但尚未在生產系統上進行試執行，就草草收場了，至於後來發現有問題，再被動式修改，因此終端使用者就痛苦了。我不期望開發人員成為DBA，但我們編寫程式碼時必須考慮生產時的問題，如果不在開發初期這麼做，DBA發現後只能迫使我們返工。我們通常說資料庫除錯是一門技術，更是一門藝術，這是因為很少有現成的規則可以適應一切問題的解決，你在一個系統上解決的問題在另一個系統上可能就不是問題了，反之亦然。涉及到查詢調整時，沒有一個答案是完全正確的，但這並不意味著你應該放棄。適當遵循一些原則可以讓工作變得更加輕鬆，本文就列舉7個可以靈活運用的原則，它們可以幫助你提高SQL查詢速度，當然這些技巧你可以諮詢DBA獲得更多的資訊。

步驟/方法

1、用case代替update
要更新一條記錄，我們立即會想到update，這個問題非常常見，許多開發人員經常忽視這個原則，因為使用update看起來非常自然，非常合乎邏輯。假設你從Customer表中提取記錄，你想將超過10萬美元的訂單標記為“Preferred”，因此你會想到使用一條update語句將CustomerRank列更新為“Preferred”，問題是update語句是有日誌的，這就意味著每條記錄它會寫兩次，解決這個問題的辦法就是在SQL查詢中內嵌case語句，在向表寫入“Preferred”標誌前，它會用訂單金額條件對每一行進行檢查，滿足條件的才會更新，效能的提升是驚人的。

2、不要盲目地重用程式碼
這個問題也非常常見，在工作中直接用別人寫好的程式碼是一件痛快的事情，你知道這些程式碼可以查詢出你需要的資料，但問題是往往有些資料不是你需要的，但我們常常不願意做一下修改，因此返回的資料集往往是一個超集，很可能多用一個外連線或是一個where子句就可以解決問題，因此在複用程式碼時最好檢查一下，如有必要略做適應性修改。

3、只提取你需要的列這個問題和2有點類似，但這次是指定具體的列。也許我們在使用select * 時感覺很暢快，多省事呀!如果要將每個列名都寫出來，太麻煩了，這是很多人的想法，但這種想法是錯誤的，因為這樣做會取出多餘的資料列，我無數次看到犯這種錯誤的程式碼，曾經有一位開發人員對一張有120列，上百萬行資料的表使用select * 查詢，但他只會用到其中的三五列，這是對資源的極大浪費，我們建議拒絕書寫select * ，你要什麼就查詢什麼，多餘的返回結果對你沒用，雖然不影響你要實現的功能，但對資料庫效能卻有極大的影響。

4、儘可能只查詢一次大表
這也是我看到很多人犯的錯誤，例如，某儲存過程從一張上百萬條記錄的大表中取資料，開發人員想提取居住在加利福利亞且收入高於4萬美元的客戶資訊，因此它先將居住在加利福利亞的客戶取出放在一張臨時表中，然後再查詢收入高於4萬美元的客戶，將查詢結果放入另一張臨時表中，最後，他連線這兩張臨時表查詢出最終的結果。可能有人認為我是在開玩笑吧?但事實是確實有人這麼做，這應該在一個查詢中就能完成，卻查詢了兩次大表。有種稍微不同的情況是，當一個過程中的多個步驟需要大表的子集時，每一步可能都必須查詢一次大表。避免多次查詢的辦法是持久化第一次查詢的子集，然後將後面的步驟指向該持久化子集。

5、使用臨時表
這個問題解決起來可能稍微有點麻煩，但其效果比較明顯，其實在很多時候你都可以使用臨時表，通過臨時表可以有效地減少對大表的操作，如果你必須連線一個表到大表，並且在大表上有條件，這時就可以將大表中需要的資料輸出到臨時表中，然後再用該臨時表進行連線，這樣查詢速度會有明顯改進。如果你的儲存過程中有多個查詢需要需要連線到相同的表時，也可以使用臨時表。

6、預存資料
這一條是我最喜歡的，因為它是一項很老的技術，常常被人們忽視，如果你有一個報表或儲存過程需要連線大表，提前提取大表中的資料，持久化儲存到另一張表中，報表就可以使用預存的資料集，從而提高整體執行效率。並不是所有時候你都有機會利用該技術，但一旦能利用上，你會發現它是節省伺服器資源很有效的辦法。但遺憾的是，很多開發人員都在盡力迴避這種技術，實際上只需要建立一個檢視就可以把問題解決了，但這種方法的問題是每個需要它的報表執行時都會執行一次，但對於同一個報表，假設10分鐘前運行了一次，現在有人要再執行該報表，那麼對大表的連線操作就可以避免掉了。我建議對那些經常被查詢的表使用該技術將資料預存起來，可以節省大量的伺服器資源。

7、分批刪除和更新
這也是一個容易被忽視的技巧，對一個大表做資料刪除或更新操作，如果操作不當可能是一場噩夢，問題是這兩種操作都是單一的事務，如果你需要殺死它們，或它們在執行時系統遇到問題，必須全部回滾整個事務，這個時間可能非常長，這就是為什麼我們在刪除數十萬條記錄時，如果試圖中途殺死程序幾乎沒用的原因，這些操作也會影響到其它事務，搞不好會造成死迴圈，因此應慎用。解決這個問題的辦法就是分批少量刪除或更新，首先，無論什麼原因需要結束事務，只需要回滾少量的行，此外，小批量提交資料寫入磁碟，對I/O的要求也更低，併發性可以大大提高。另外要提醒的是，執行刪除和更新操作應儘量選擇非高峰時段。

總結
遵循這些方法總是能收到效果，但在實踐中，應該評估選用一種或幾種最佳方案，大家一定要記住，沒有那種辦法是萬能的。另外，這些技巧適用於所有資料庫品種，因此你必須全部掌握!

問題, 資料庫, 效能, 開發人員,

相關問題答案

Have any Question?

Let us answer it!