本文介紹MySQL改善資料裝載操作效率的策略。多時候關心的是優化SELECT 查詢,因為它們是最常用的查詢,而且確定怎樣優化它們並不總是直截了當。相對來說,將資料裝入資料庫是直截了當的。 多時候關心的是優化SELECT 查詢,因為它們是最常用的查詢,而且確定怎樣優化它們並不總是直截了當。相對來說,將資料裝入資料庫是直截了當的。然而,也存在可用來改善資料裝載操作效率的策略,其基本原理如下:
成批裝載較單行裝載更快,因為在裝載每個記錄後,不需要刷新索引高速緩存;可在成批記錄裝入後才刷新。
在表無索引時裝載比索引後裝載更快。如果有索引,不僅必須增加記錄到資料文件,而且還要修改每個索引以反映增加了的新記錄。
較短的SQL 語句比較長的SQL 語句要快,因為它們涉及伺服器方的分析較少,而且也因為將它們透過網路從客戶端傳送到伺服器更快。這些因素中有一些似乎微不足道(特別是最後一個因素),但如果要裝載大量的數據,即使是很小的因素也會產生很大的不同結果。我們可以利用上述的一般原理推導出幾個關於如何最快裝載資料的實際結論:
LOAD DATA(包括其所有形式)比INSERT 效率高,因為其成批裝載行。索引刷新較少,且伺服器只需分析和解釋一條語句而不是幾個語句。
LOAD DATA 比LOAD DATA LOCAL 更有效率。利用LOAD DATA,檔案必須定位在伺服器上,而且必須具有FILE 權限,但伺服器可從磁碟直接讀取檔案。利用LOAD DATA LOCAL,客戶機讀取檔案並將其透過網路傳送給伺服器,這樣做很慢。
如果必須使用INSERT,則應該利用允許在單一語句中指定多行的形式,例如:
語句中可指定的行越多越好。這樣會減少所需的語句數目,降低索引刷新量。如果使用mysqldump 產生資料庫備份文件,應該使用--extended-insert 選項,使轉儲文件包含多行INSERT 語句。也可以使用- - opt(最佳化) ,它啟用--extended-insert 選項。反之,應該避免使用mysqldump 的--complete-insert 選項;此選項會導致INSERT 語句為單行,執行時間更長,比不用--complete-insert 選項產生的語句需要更多的分析。
使用壓縮了的客戶機/伺服器協定以減少網路資料流量。對於大多數MySQL客戶機,可以用--compress 命令列選項來指定。它一般只用於較慢的網絡,因為壓縮需要佔用大量的處理器時間。
讓MySQL插入缺省值;不要在INSERT 語句中指定將以任意方式賦予預設值的欄位。平均來說,這樣做語句會更短,能減少透過網路傳送給伺服器的字元數。此外,語句包含的值較少,伺服器所進行的分析和轉換就會較少。
如果資料表是索引的,則可利用批次插入( LOAD DATA 或多行的INSERT 語句)來減少索引的開銷。這樣會最小化索引更新的影響,因為索引只需要在所有行處理過時才進行刷新,而不是在每行處理後就刷新。
如果需要將大量資料裝入一個新表,則應該建立該表且在未索引時裝載,裝載資料後才建立索引,這樣做較快。一次建立索引(而不是每行修改一次索引)較快。
如果在裝載之前刪除或停用索引,裝入資料後再重新建立或啟用索引可能會使裝載更快。如果想要對資料裝載使用刪除或停用策略,一定要做一些實驗,看這樣做是否值得(如果將少量資料裝入一個大表中,重建和索引所花費的時間可能比裝載資料的時間還要長)。
可用DROP INDEX 和CREATE INDEX 來刪除和重建索引。另一個可供選擇的方法是利用myisamchk 或isamchk 來停用和啟用索引。這需要在MySQL伺服器主機上有一個帳戶,並對錶檔案有寫入權。為了停用表索引,可進入對應的資料庫目錄,執行下列命令之一:
對具有.MYI 副檔名的索引檔的MyISAM 表使用myisamchk,對具有.ISM 副檔名的索引檔的ISAM 表使用isamchk。在向表中裝入資料後,請按如下啟動索引:
如果決定使用索引停用和激活,應該使用第13章中介紹的表修復鎖定協定以阻止伺服器同時更改鎖(雖然此時不對錶進行修復,但要對它像表修復過程一樣進行修改,因此需要使用相同的鎖定協定)。
上述資料裝載原理也適用於與需要執行不同操作的客戶機有關的固定查詢。例如,一般希望避免在頻繁更新的表上長時間執行SELECT 查詢。長時間執行SELECT 查詢會產生大量爭用,並降低寫入程式的效能。一種可能的解決方法為,如果執行寫入的主要是INSERT 操作,那麼先將記錄存入一個臨時表,然後定期地將這些記錄加入主表中。如果需要立即存取新記錄,這不是一個可行的方法。但只要能在一個較短的時間內不訪問它們,就可以使用這個方法。使用臨時表有兩個方面的好處。首先,它減少了與主表上SELECT 查詢語句的爭用,因此,執行更快。其次,從臨時表將記錄裝入主表的總時間較分別裝載記錄的總時間少;相應的索引高速緩存只需在每個批量裝載結束時進行刷新,而不是在每行裝載後刷新。這個策略的一個應用是進入Web 伺服器的Web 頁存取MySQL資料庫。在此情況下,可能沒有保證記錄立即進入主表的較高權限。
如果資料不完全是那種在系統非正常關閉事件中插入的單一記錄,那麼減少索引刷新的另一策略是使用MyISAM 表的DELAYED_KEY_WRITE 表建立選項(如果將MySQL用於某些資料輸入工作時可能會出現這種情況)。此選項使索引快取只偶爾刷新,而不是在每次插入後都要刷新。
如果希望在伺服器範圍內利用延遲索引刷新,只要利用--delayed-key-write 選項啟動mysqld 即可。在此情形下,索引區塊寫入操作延遲到必須刷新區塊以便為其他索引值騰出空間為止,或延遲到執行了一個flush-tables 指令後,或延遲到該索引表關閉。
-