-
MySQL 備份與復原週六, 2006/09/30 - 14:21 — yejr
MySQL 備份與還原
作/譯者:葉金榮(Email: ),來源: http://imysql.cn ,轉載請註明作/譯者和出處,並且不能用於商業用途,違者必究。
日期:2006/10/01
本文討論MySQL 的備份和復原機制,以及如何維護資料表,包括最主要的兩種表類型:MyISAM 和Innodb ,文中設計的MySQL 版本為5.0.22。
目前MySQL 支援的免費備份工具有:mysqldump、mysqlhotcopy ,還可以用SQL 語法進行備份:BACKUP TABLE 或SELECT INTO OUTFILE ,又或備份二進位日誌(binlog) ,還可以是直接拷貝資料檔和相關的設定檔。 MyISAM 表是保存成文件的形式,因此相對比較容易備份,上面提到的幾種方法都可以使用。 Innodb 所有的表格都保存在同一個資料檔案ibdata1 中(也可能是多個文件,或是獨立的表空間檔案),相對來說比較不好備份,免費的方案可以是拷貝資料檔案、備份binlog ,或用mysqldump 。
1、mysqldump
1.1 備份
mysqldump 是採用SQL層級的備份機制,它將資料表導成SQL 腳本文件,在不同的MySQL 版本之間升級時相對比較合適,這也是最常用的備份方法。
現在來講一下mysqldump 的一些主要參數:
--compatible=name
它告訴mysqldump,導出的資料將和哪種資料庫或哪個舊版的MySQL 伺服器相容。數值可以是ansi、mysql323、mysql40、postgresql、oracle、mssql、db2、maxdb、no_key_options、no_tables_options、no_field_options 等,要使用幾個值,用逗號將它們分開。當然了,它並不保證能完全相容,而是盡量相容。
--complete-insert,-c
導出的資料採用包含欄位名的完整INSERT 方式,也就是把所有的值都寫在一行。這麼做能提高插入效率,但可能會受到max_allowed_packet 參數的影響而導致插入失敗。因此,需要謹慎使用該參數,至少我不建議。
--default-character-set=charset
指定匯出資料時採用何種字元集,如果資料表不是採用預設的latin1 字元集的話,那麼匯出時必須指定該選項,否則再次匯入資料後將產生亂碼問題。
--disable-keys
告訴mysqldump 在INSERT 語句的開頭和結尾增加/*!40000 ALTER TABLE table DISABLE KEYS */; 和/*!40000 ALTER TABLE table ENABLE KEYS */; 語句,這能大大提高插入語句的速度,因為它是在插入完所有資料後才重建索引的。該選項只適合MyISAM 表。
--extended-insert = true|false
預設情況下,mysqldump 開啟--complete-insert 模式,因此不想用它的的話,就使用本選項,設定它的值為false 即可。
--hex-blob
使用十六進位格式匯出二進位字串欄位。如果有二進位資料就必須使用本選項。影響到的欄位類型有BINARY、VARBINARY、BLOB 。
--lock-all-tables,-x
在開始匯出之前,提交請求鎖定所有資料庫中的所有表,以確保資料的一致性。這是一個全域讀鎖,並且自動關閉--single-transaction 和--lock-tables 選項。
--lock-tables
它和--lock-all-tables 類似,不過是鎖定目前匯出的資料表,而不是一下子鎖定全部庫下的表。此選項只適用於MyISAM 表,如果是Innodb 表可以用--single-transaction 選項。
--no-create-info,-t
只匯出數據,而不加入CREATE TABLE 語句。
--no-data,-d
不匯出任何數據,只匯出資料庫表結構。
--opt
這只是一個快速選項,等於同時加入--add-drop-tables --add-locking --create-option --disable-keys --extended-insert --lock-tables --quick --set-charset選項。本選項能讓mysqldump 很快的匯出數據,且匯出的數據能很快導回。此選項預設為開啟,但可用--skip-opt 停用。請注意,如果執行mysqldump 沒有指定--quick 或--opt 選項,則會將整個結果集放在記憶體中。如果匯出大資料庫的話可能會出現問題。
--quick,-q
這個選項在匯出大表時很有用,它強制mysqldump 從伺服器查詢取得記錄直接輸出而不是取得所有記錄後將它們快取到記憶體中。
--routines,-R
匯出預存程序以及自訂函數。
--single-transaction
此選項在匯出資料之前提交一個BEGIN SQL語句,BEGIN 不會阻塞任何應用程式且能保證匯出時資料庫的一致性狀態。它只適用於事務表,例如InnoDB 和BDB 。
此選項和--lock-tables 選項是互斥的,因為LOCK TABLES 會使任何掛起的事務隱含提交。
要匯出大表的話,應結合使用--quick 選項。
--triggers
同時導出觸發器。該選項預設啟用,用--skip-triggers 停用它。
其他參數詳情請參考手冊,我通常使用以下SQL 來備份MyISAM 表:
/usr/local/mysql/bin/mysqldump -uyejr -pyejr
--default-character-set=utf8 --opt --extended-insert=false
--triggers -R --hex-blob -x db_name > db_name.sql
使用下列SQL 來備份Innodb 表:
/usr/local/mysql/bin/mysqldump -uyejr -pyejr
--default-character-set=utf8 --opt --extended-insert=false
--triggers -R --hex-blob --single-transaction db_name > db_name.sql
另外,如果想要實現線上備份,也可以使用--master-data 參數來實現,如下:
/usr/local/mysql/bin/mysqldump -uyejr -pyejr
--default-character-set=utf8 --opt --master-data=1
--single-transaction --flush-logs db_name > db_name.sql
它只是在一開始的瞬間請求鎖定表,然後就刷新binlog了,而後在導出的文件中加入CHANGE MASTER 語句來指定當前備份的binlog位置,如果要把這個文件恢復到slave裡去,就可以採用這種方法來做。
1.2 還原用mysqldump 備份出來的檔案是一個可以直接倒入的SQL 腳本,有兩種方法可以將資料匯入。
直接用mysql 客戶端例如:
/usr/local/mysql/bin/mysql -uyejr -pyejr db_name < db_name.sql
用SOURCE 語法其實這不是標準的SQL 語法,而是mysql 用戶端提供的功能,例如:
SOURCE /tmp/db_name.sql;
這裡需要指定檔案的絕對路徑,並且必須是mysqld 運行用戶(例如nobody)有權限讀取的檔案。
2、 mysqlhotcopy
2.1 備份
mysqlhotcopy 是一個PERL 程序,最初由Tim Bunce編寫。它使用LOCK TABLES、FLUSH TABLES 和cp 或scp 來快速備份資料庫。它是備份資料庫或單一表格的最快的途徑,但它只能運行在資料庫檔案(包括資料表定義檔案、資料檔案、索引檔案)所在的機器上。 mysqlhotcopy 只能用於備份MyISAM ,並且只能運行在類別Unix 和NetWare 系統上。
mysqlhotcopy 支援一次性拷貝多個資料庫,同時也支援正規表示。以下是幾個例子:
root#/usr/local/mysql/bin/mysqlhotcopy -h=localhost -u=yejr -p=yejr
db_name /tmp (把資料庫目錄db_name
拷貝到/tmp
下)
root#/usr/local/mysql/bin/mysqlhotcopy -h=localhost -u=yejr -p=yejr
db_name_1 ... db_name_n /tmp
root#/usr/local/mysql/bin/mysqlhotcopy -h=localhost -u=yejr -p=yejr
db_name./regex/ /tmp
更詳細的使用方法請查看手冊,或呼叫下面的指令來查看mysqlhotcopy 的幫助:
perldoc /usr/local/mysql/bin/mysqlhotcopy
注意,想要使用mysqlhotcopy ,必須要有SELECT、RELOAD(要執行FLUSH TABLES) 權限,也必須要能夠有讀取datadir/db_name 目錄的權限。
2.2 還原
mysqlhotcopy 備份出來的是整個資料庫目錄,使用時可以直接拷貝到mysqld 指定的datadir (在這裡是/usr/local/mysql/data/ )目錄下即可,同時要注意權限的問題,如下例:
root#cp -rf db_name /usr/local/mysql/data/
root#chown -R nobody:nobody /usr/local/mysql/data/ (將db_name 目錄的屬主改成mysqld
運行用戶)
3、 SQL 語法備份
3.1 備份
BACKUP TABLE 語法其實跟mysqlhotcopy 的工作原理差不多,都是鎖定表,然後拷貝資料檔。它能實現線上備份,但是效果不理想,因此不建議使用。它只拷貝表結構文件和資料文件,不同時拷貝索引文件,因此恢復時比較慢。
例子:
BACK TABLE tbl_name TO '/tmp/db_name/';
注意,必須要有FILE 權限才能執行本SQL,而且目錄/tmp/db_name/ 必須能被mysqld 使用者可寫,匯出的文件不能覆寫已經存在的文件,以避免安全性問題。
SELECT INTO OUTFILE 就是把資料匯出為普通的文字文件,可以自訂欄位間隔的方式,方便處理這些資料。
例子:
SELECT * INTO OUTFILE '/tmp/db_name/tbl_name.txt' FROM tbl_name;
注意,必須要有FILE 權限才能執行本SQL,且檔案/tmp/db_name/tbl_name.txt 必須能被mysqld 使用者可寫,匯出的檔案不能覆寫已經存在的文件,以避免安全性問題。
3.2 還原用BACKUP TABLE 方法備份出來的文件,可以執行RESTORE TABLE 語句來還原資料表。
例子:
RESTORE TABLE FROM '/tmp/db_name/';
權限要求類似上面所述。
用SELECT INTO OUTFILE 方法備份出來的文件,可以執行LOAD DATA INFILE 語句來還原資料表。
例子:
LOAD DATA INFILE '/tmp/db_name/tbl_name.txt' INTO TABLE tbl_name;
權限要求類似上面所述。倒入資料之前,資料表要已經存在才行。如果擔心資料會發生重複,可以增加REPLACE 關鍵字來取代已有記錄或用IGNORE 關鍵字來忽略他們。
4、啟用二進位日誌(binlog)
採用binlog 的方法相對來說更靈活,省心省力,而且還可以支援增量備份。
啟用binlog 時必須要重新啟動mysqld 。首先,關閉mysqld ,開啟my.cnf ,加入以下幾行:
server-id = 1
log-bin = binlog
log-bin-index = binlog.index
然後啟動mysqld 就可以了。運行過程中會產生binlog.000001 以及binlog.index ,前面的檔案是mysqld 記錄所有對資料的更新操作,後面的檔案則是所有binlog 的索引,都不能輕易刪除。關於binlog 的資訊請查看手冊。
需要備份時,可以先執行一下SQL 語句,讓mysqld 終止目前binlog 的寫入,就可以把檔案直接備份,這樣的話就能達到增量備份的目的了:
FLUSH LOGS;如果是備份複製系統中的從伺服器,也應該備份master.info 和relay-log.info 檔案。
備份出來的binlog 檔案可以用MySQL 提供的工具mysqlbinlog 來查看,如:
/usr/local/mysql/bin/mysqlbinlog /tmp/binlog.000001
工具可讓你顯示指定的資料庫下的所有SQL 語句,而且還可以限定時間範圍,相當的方便,詳細的請查看手冊。
恢復時,可以採用類似以下語句來做到:
/usr/local/mysql/bin/mysqlbinlog /tmp/binlog.000001 | mysql -uyejr -pyejr db_name
把mysqlbinlog 輸出的SQL 語句直接當作輸入來執行它。
如果你有空閒的機器,不妨採用這種方式來備份。由於作為slave 的機器效能要求相對不是那麼高,因此成本低,用低成本就能實現增量備份而且還能分擔一部分資料查詢壓力,何樂而不為呢?
5. 直接備份資料檔相較前幾種方法,備份資料檔最直接、快速、方便,缺點是基本上無法實現增量備份。為了確保資料的一致性,需要在靠背檔案前,執行以下SQL 語句:
FLUSH TABLES WITH READ LOCK;也就是把記憶體中的資料都刷新到磁碟中,同時鎖定資料表,以確保拷貝過程中不會有新的資料寫入。這種方法備份出來的資料復原也很簡單,直接拷貝回原來的資料庫目錄下即可。
注意,對於Innodb 類型表來說,也需要備份其日誌文件,即ib_logfile* 文件。因為當Innodb 表損壞時,就可以依賴這些日誌檔案來復原。
6. 備份策略對於中型業務量的系統來說,備份策略可以這麼定:第一次全量備份,每天一次增量備份,每週再做一次全量備份,如此一直重複。而對於重要且繁忙的系統來說,可能需要每天一次全量的備份,每小時一次增量備份,甚至更頻繁。為了不影響線上業務,實現線上備份,並且能增量備份,最好的方法就是採用主從複製機制(replication ),在slave 機器上做備份。
7. 資料維護與災難復原作為一名DBA(我目前還不是,呵呵),最重要的工作內容之一是確保資料表能安全、穩定、高速使用。因此,需要定期維護你的資料表。以下SQL 語句就很有用:
CHECK TABLE 或REPAIR TABLE,檢查或維護MyISAM 表
OPTIMIZE TABLE,優化MyISAM 表
ANALYZE TABLE,分析MyISAM 表當然了,上面這些指令起始都可以透過工具myisamchk 來完成,這裡不作詳述。
Innodb 表則可以執行以下語句來整理碎片,提高索引速度:
ALTER TABLE tbl_name ENGINE = Innodb;
這其實是NULL 操作,表面上看什麼都不做,實際上重新整理碎片了。
通常使用的MyISAM 表可以用上面提到的恢復方法來完成。如果是索引壞了,可以用myisamchk 工具來重建索引。而對於Innodb 表來說,就沒這麼直接了,因為它把所有的表都保存在一個表空間了。不過Innodb 有一個檢查機制叫模糊檢查點,只要儲存了日誌文件,就能根據日誌檔案來修復錯誤。可以在my.cnf 檔案中,增加以下參數,讓mysqld 在啟動時自動檢查日誌檔:
innodb_force_recovery = 4
關於該參數的資訊請查看手冊。
8. 總結做好資料備份,定只好適合的備份策略,這是一個DBA所做事情的一小部分,萬事起頭難