一、線程概述
執行緒是程式運行的基本執行單元。當作業系統(不包括單執行緒的作業系統,如微軟早期的DOS)在執行一個程式時,會在系統中建立一個行程,而在這個行程中,必須至少建立一個執行緒(這個執行緒稱為主線程)來作為這個程式運行的入口點。因此,在作業系統中運行的任何程式都至少有一個主執行緒。
行程和執行緒是現代作業系統中兩個必不可少的運行模型。在作業系統中可以有多個進程,這些進程包括系統進程(由作業系統內部建立的進程)和用戶進程(由用戶程式建立的進程);一個進程中可以有一個或多個執行緒。進程和進程之間不共享內存,也就是說系統中的進程是在各自獨立的內存空間中運行的。而一個行程中的線可以共享系統分派給這個行程的記憶體空間。
線程不僅可以共享進程的內存,而且還擁有一個屬於自己的內存空間,這段內存空間也叫做線程棧, 是在建立線程時由系統分配的,主要用來保存線程內部所使用的數據,如線程執行函數中所定義的變數。
注意:任何一個執行緒在建立時都會執行一個函數,這個函數叫做執行緒執行函數。也可以將這個函數看做執行緒的入口點(類似程式中的main函數)。無論使用什麼語言或技術來建立線程,都必須執行這個函數(這個函數的表現形式可能不一樣,但都會有一個這樣的函數)。如在Windows中用來建立執行緒的API函數CreateThread的第三個參數就是這個執行函數的指標。
在作業系統將進程分成多個執行緒後,這些執行緒可以在作業系統的管理下並發執行,這大大提高了程式的運作效率。雖然執行緒的執行從宏觀上看是多個執行緒同時執行,但實際上這只是作業系統的障眼法。由於一塊CPU同時只能執行一條指令,因此,在擁有一塊CPU的電腦上不可能同時執行兩個任務。而作業系統為了能提高程式的運作效率,在一個線程空閒時會撤下這個線程,並且會讓其他的線程來執行,這種方式叫做線程調度。我們之所以從表面上看是多個線程同時執行,是因為不同線程之間切換的時間非常短,而且在一般情況下切換非常頻繁。假設我們有線程A和B。在運行時,可能是A執行了1毫秒後,切換到B後,B又執行了1毫秒,然後又切換到了A,A又執行1毫秒。由於1毫秒的時間對一般人來說是很難感知的,因此,從表面看上去就像A和B同時執行一樣,但實際上A和B是交替執行的。
二、線程帶給我們的好處
如果能合理地使用線程,將會減少開發和維護成本,甚至可以改善複雜應用程式的效能。如在GUI應用程式中,也以透過執行緒的非同步特性來更好地處理事件;在應用程式伺服器程式中可以透過建立多個執行緒來處理客戶端的請求。執行緒甚至還可以簡化虛擬機器的實現,如Java虛擬機(JVM)的垃圾回收器(garbage collector)通常運行在一個或多個執行緒中。因此,使用線程將會從以下五個方面來改善我們的應用程式:
1. 充分利用CPU資源
現在世界上大多數電腦只有一塊CPU。因此,充分利用CPU資源顯得格外重要。當執行單執行緒程式時,由於在程式發生阻塞時CPU可能會處於空閒狀態。這將造成大量的計算資源的浪費。而在程式中使用多執行緒可以在某一個執行緒處於休眠或阻塞時,而CPU又恰好處於空閒狀態時來執行其他的執行緒。這樣CPU就很難有空閒的時候。因此,CPU資源就被充分利用了。
2. 簡化程式設計模型
如果程式只完成一項任務,那就只要寫一個單執行緒的程序,並且按著執行這個任務的步驟編寫程式碼即可。但要完成多項任務,如果還使用單執行緒的話,那就得在程式中判斷每項任務是否應該執行以及何時執行。如顯示一個時鐘的時、分、秒三個指針。使用單線程就得在循環中逐一判斷這三個指針的轉動時間和角度。如果使用三個線程分另來處理這三個指標的顯示,那麼對於每個線程來說就是指行一個單獨的任務。這樣有助於開發人員對程式的理解與維護。
3. 簡化非同步事件的處理
當一個伺服器應用程式在接收不同的客戶端連線時最簡單地處理方法就是為每個客戶端連線建立一個執行緒。然後監聽線程仍然負責監聽來自客戶端的請求。如果這種應用程式採用單線程來處理,當監聽線程接收到一個客戶端請求後,開始讀取客戶端發來的數據,在讀完數據後,read方法處於阻塞狀態,也就是說,這個線程將無法再監聽客戶端請求了。而要想在單線程中處理多個客戶端請求,就必須使用非阻塞的Socket連線和非同步I/O。但使用非同步I/O方式比使用同步I/O更難控制,也更容易出錯。因此,使用多執行緒和同步I/O可以更容易處理類似多請求的非同步事件。
4. 使GUI更有效率
使用單執行緒來處理GUI事件時,必須使用循環來對隨時可能發生的GUI事件進行掃描,在循環內部除了掃描GUI事件外,還得來執行其他的程式碼。如果這些程式碼太長,那麼GUI事件就會被“凍結”,直到這些程式碼被執行完為止。
在現代的GUI框架(如SWING、AWT和SWT)中都使用了一個單獨的事件分派線程(event dispatch thread,EDT)來掃描GUI事件。當我們按下一個按鈕時,按鈕的點選事件函數會在這個事件分派執行緒中被呼叫。由於EDT的任務只是對GUI事件進行掃描,因此,這種方式對事件的反映是非常快速的。
5. 節約成本
提高程序的執行效率一般有三種方法:
(1)增加計算機的CPU個數。
(2)為一個程式啟動多個進程
(3)在程式中使用多進程。
第一種方法是最容易做到的,但同時也是最昂貴的。這種方法不需要修改程序,從理論上說,任何程序都可以使用這種方法來提高執行效率。第二種方法雖然不用購買新的硬件,但這種方式不容易共享數據,如果這個程式要完成的任務需要必須要共享數據的話,這種方式就不太方便,而且啟動多個線程會消耗大量的系統資源。第三種方法恰好彌補了第一種方法的缺點,而又繼承了它們的優點。也就是說,既不需要購買CPU,也不會因為啟動太多的執行緒而佔用大量的系統資源(在預設情況下,一個執行緒所佔的記憶體空間要遠比一個行程所佔的記憶體空間小得多),多執行緒可以模擬多區塊CPU的運作方式,因此,使用多執行緒是提高程式執行效率的最廉價的方式。
三、Java的執行緒模型
由於Java是純粹物件導向語言,因此,Java的執行緒模型也是物件導向的。 Java透過Thread類別將執行緒所必須的功能都封裝了起來。要建立一個線程,必須要有一個線程執行函數,這個線程執行函數對應Thread類別的run方法。 Thread類別還有一個start方法,這個方法負責建立線程,相當於呼叫Windows的建立線程函數CreateThread。當呼叫start方法後,如果執行緒建立成功,並自動呼叫Thread類別的run方法。因此,任何繼承Thread的Java類別都可以透過Thread類別的start方法來建立執行緒。如果想運行自己的執行緒執行函數,那就要覆寫Thread類別的run方法。
在Java的執行緒模型中除了Thread類,還有一個標識某個Java類別是否可作為執行緒類別的介面Runnable,這個介面只有一個抽象方法run,也就是Java執行緒模型的執行緒執行函數。因此,一個執行緒類別的唯一標準就是這個類別是否實作了Runnable介面的run方法,也就是說,擁有執行緒執行函數的類別就是線程類別。
從上面可以看出,在Java中建立線程有兩種方法,一種是繼承Thread類,另一種是實現Runnable接口,並通過Thread和實現Runnable的類來建立線程,其實這兩種方法從本質上說是一種方法,就是透過Thread類別來建立線程,並執行run方法的。但它們的大區別是透過繼承Thread類別來建立線程,雖然在實現起來更容易,但由於Java不支援多繼承,因此,這個線程類別如果繼承了Thread,就不能再繼承其他的類別了,因此, Java線程模型提供了透過實作Runnable介面的方法來建立線程,這樣線程類別就可以在必要的時候繼承和業務有關的類,而不是Thread類別。