1. Frekuensi prosesor server
Frekuensi utama prosesor server juga disebut frekuensi clock. Satuannya adalah MHz dan digunakan untuk menunjukkan kecepatan komputasi CPU. Frekuensi utama CPU = FSB × faktor perkalian. Banyak orang yang beranggapan bahwa frekuensi utama menentukan kecepatan berjalannya CPU. Hal ini tidak hanya bersifat sepihak, namun bagi server pun pemahaman ini juga bias. Sejauh ini, belum ada formula pasti yang dapat mewujudkan hubungan numerik antara frekuensi utama dan kecepatan komputasi sebenarnya. Bahkan dua produsen prosesor besar Intel dan AMD memiliki perselisihan yang hebat mengenai hal ini. Kami mulai dari Intel Melihat tren pengembangan produk , terlihat bahwa Intel sangat mementingkan penguatan pengembangan frekuensi utamanya sendiri. Seperti produsen prosesor lainnya, ada yang pernah membandingkannya dengan prosesor Transmeta 1G. Efisiensi pengoperasiannya setara dengan prosesor Intel 2G.
Oleh karena itu, frekuensi utama CPU tidak berhubungan langsung dengan daya komputasi aktual CPU. Frekuensi utama menunjukkan kecepatan osilasi sinyal pulsa digital dalam CPU. Kita juga dapat melihat contohnya pada produk prosesor Intel: chip Itanium 1 GHz dapat bekerja hampir sama cepatnya dengan 2,66 GHz Xeon/Opteron, atau 1,5 GHz Itanium 2 sama cepatnya dengan 4 GHz Xeon/Opteron. Kecepatan komputasi CPU juga bergantung pada indikator kinerja berbagai aspek pipeline CPU.
Tentu saja frekuensi utama berkaitan dengan kecepatan komputasi sebenarnya. Hanya dapat dikatakan bahwa frekuensi utama hanyalah salah satu aspek kinerja CPU dan tidak mewakili kinerja CPU secara keseluruhan.
2. Frekuensi bus sisi depan server (FSB).
Frekuensi front-side bus (FSB) (yaitu frekuensi bus) secara langsung mempengaruhi kecepatan pertukaran data langsung antara CPU dan memori. Ada rumus yang bisa dihitung yaitu bandwidth data = (frekuensi bus × bandwidth data)/8. Bandwidth maksimum transmisi data bergantung pada lebar dan frekuensi transmisi seluruh data yang dikirimkan secara bersamaan. Misalnya, Xeon Nocona saat ini yang mendukung 64-bit memiliki front-side bus 800MHz. Menurut rumusnya, bandwidth transmisi data maksimumnya adalah 6,4GB/detik.
Perbedaan antara frekuensi FSB dan FSB: Kecepatan FSB mengacu pada kecepatan transmisi data, dan FSB adalah kecepatan operasi sinkron antara CPU dan motherboard. Dengan kata lain, FSB 100MHz secara spesifik mengacu pada sinyal pulsa digital yang berosilasi sepuluh juta kali per detik; sedangkan front-side bus 100MHz mengacu pada jumlah transmisi data yang dapat diterima CPU per detik, yaitu 100MHz×64bit±8Byte. /bit=800MB/dtk.
Faktanya, kemunculan arsitektur "HyperTransport" telah mengubah frekuensi front-side bus (FSB) yang sebenarnya. Kita sebelumnya telah mengetahui bahwa arsitektur IA-32 harus memiliki tiga komponen penting: Memory Controller Hub (MCH), I/O Controller Hub, dan PCI Hub, seperti chipset khas Intel, chipset Intel 7501 dan Intel7505, yang merupakan prosesor dual Xeon dibuat khusus. KIA yang dikandungnya menyediakan CPU dengan frekuensi bus sisi depan 533MHz. Dengan memori DDR, bandwidth bus sisi depan dapat mencapai 4,3GB/detik.
Namun, seiring dengan peningkatan kinerja prosesor, hal ini juga membawa banyak masalah pada arsitektur sistem. Arsitektur "HyperTransport" tidak hanya memecahkan masalah, tetapi juga meningkatkan bandwidth bus secara lebih efektif, seperti prosesor AMD Opteron. Arsitektur bus HyperTransport I/O yang fleksibel memungkinkannya untuk mengintegrasikan pengontrol memori, sehingga prosesor tidak mengirimkan data melalui bus sistem. Chipset bertukar data secara langsung dengan memori. Dalam hal ini, saya tidak tahu harus mulai dari mana membicarakan frekuensi front-side bus (FSB) pada prosesor AMD Opteron.
3. Prosesor FSB
FSB adalah frekuensi dasar CPU, dan satuannya juga MHz. FSB CPU menentukan kecepatan lari seluruh motherboard. Terus terang, di komputer desktop, yang kami sebut overclocking mengacu pada overclocking FSB CPU (tentu saja, dalam keadaan normal, pengganda CPU terkunci). Namun untuk CPU server, overclocking sama sekali tidak diperbolehkan. Seperti disebutkan sebelumnya, CPU menentukan kecepatan berjalan motherboard. Keduanya berjalan secara sinkron. Jika CPU server di-overclock dan FSB diubah, operasi asinkron akan terjadi (Banyak motherboard desktop mendukung operasi asinkron.) Ini akan menyebabkan keseluruhan server untuk berjalan secara asinkron.
Di sebagian besar sistem komputer saat ini, FSB juga merupakan kecepatan lari sinkron antara memori dan motherboard. Dengan cara ini, dapat dipahami bahwa FSB CPU terhubung langsung ke memori untuk mencapai status pengoperasian sinkron antara keduanya. Sangat mudah untuk membingungkan frekuensi FSB dan FSB. Mari kita bahas perbedaan keduanya dalam pengenalan FSB berikut.
4. Bit CPU dan panjang kata
Bit: Biner digunakan dalam sirkuit digital dan teknologi komputer, dan kodenya hanya "0" dan "1". Baik "0" atau "1" adalah "bit" di CPU.
Panjang kata: Dalam teknologi komputer, jumlah digit biner yang dapat diproses CPU pada satu waktu per satuan waktu (pada waktu yang sama) disebut panjang kata. Oleh karena itu, CPU yang dapat memproses data dengan panjang word 8 bit biasa disebut CPU 8-bit. Dengan cara yang sama, CPU 32-bit dapat memproses data biner dengan panjang kata 32 bit per satuan waktu. Perbedaan antara byte dan panjang kata: Karena karakter bahasa Inggris yang umum digunakan dapat diwakili oleh biner 8-bit, 8 bit biasanya disebut byte. Panjang kata tidak tetap, dan panjang kata berbeda untuk CPU yang berbeda. CPU 8-bit hanya dapat memproses satu byte dalam satu waktu, sedangkan CPU 32-bit dapat memproses 4 byte dalam satu waktu. Demikian pula, CPU 64-bit dapat memproses 8 byte dalam satu waktu.
5. Koefisien perkalian frekuensi
Faktor perkalian mengacu pada hubungan proporsional relatif antara frekuensi utama CPU dan FSB. Di bawah FSB yang sama, semakin tinggi pengali frekuensi, semakin tinggi pula frekuensi CPU. Namun faktanya, di bawah premis FSB yang sama, CPU dengan pengganda tinggi itu sendiri tidak terlalu penting. Hal ini karena kecepatan transmisi data antara CPU dan sistem terbatas. Sebuah CPU yang secara membabi buta mengejar pengganda tinggi dan memperoleh frekuensi utama yang tinggi akan memiliki efek "hambatan" yang jelas - kecepatan maksimum CPU memperoleh data dari sistem. tidak dapat memenuhi persyaratan komputasi CPU. Secara umum, kecuali untuk sampel teknik, CPU Intel memiliki pengganda yang terkunci, namun AMD belum pernah menguncinya sebelumnya.
6. cache CPU
Ukuran cache juga merupakan salah satu indikator penting dari CPU, dan struktur serta ukuran cache mempunyai pengaruh yang besar terhadap kecepatan CPU. Cache di CPU berjalan pada frekuensi yang sangat tinggi, umumnya beroperasi pada frekuensi yang sama dengan prosesor, dan efisiensi kerjanya jauh lebih besar dibandingkan memori sistem dan harddisk. Dalam pekerjaan sebenarnya, CPU sering kali perlu membaca blok data yang sama berulang kali, dan peningkatan kapasitas cache dapat sangat meningkatkan kecepatan pembacaan data di dalam CPU tanpa harus mencarinya di memori atau hard disk, sehingga meningkatkan sistem. pertunjukan. . Namun, karena faktor-faktor seperti area chip CPU dan biaya, cache menjadi sangat kecil.
L1 Cache (cache level satu) adalah cache level pertama CPU, yang dibagi menjadi cache data dan cache instruksi. Kapasitas dan struktur cache L1 bawaan memiliki dampak yang lebih besar pada kinerja CPU. Namun, memori cache terdiri dari RAM statis dan memiliki struktur yang rumit. Ketika area mati CPU tidak boleh terlalu besar, maka kapasitasnya akan berkurang cache L1 tidak mencukupi. Mungkin dibuat terlalu besar. Kapasitas cache L1 dari CPU server umum biasanya 32-256KB.
L2 Cache (cache tingkat kedua) adalah cache lapisan kedua CPU, yang dibagi menjadi chip internal dan eksternal. Cache L2 internal pada chip berjalan pada kecepatan yang sama dengan frekuensi utama, sedangkan cache L2 eksternal hanya berjalan pada setengah frekuensi utama. Kapasitas cache L2 juga akan mempengaruhi kinerja CPU. Prinsipnya semakin besar semakin baik. Kapasitas terbesar CPU rumahan saat ini adalah 512KB, sedangkan cache L2 CPU di server dan workstation setinggi 256-. 1MB, dan ada pula yang setinggi 2MB atau 3MB.
L3 Cache (cache tiga tingkat) dibagi menjadi dua jenis. Yang awal bersifat eksternal, dan yang sekarang bersifat bawaan. Efek sebenarnya adalah penerapan cache L3 dapat mengurangi latensi memori lebih lanjut dan meningkatkan kinerja prosesor saat menghitung data dalam jumlah besar. Mengurangi latensi memori dan meningkatkan kemampuan komputasi data besar sangat membantu untuk game. Di bidang server, penambahan cache L3 masih mengalami peningkatan performa yang signifikan. Misalnya, konfigurasi dengan cache L3 yang lebih besar akan menggunakan memori fisik secara lebih efisien, sehingga dapat menangani lebih banyak permintaan data dibandingkan subsistem I/O disk yang lebih lambat. Prosesor dengan cache L3 yang lebih besar memberikan perilaku cache sistem file yang lebih efisien serta panjang antrian pesan dan prosesor yang lebih pendek.
Faktanya, cache L3 paling awal diterapkan pada prosesor K6-III yang dirilis oleh AMD. Cache L3 pada saat itu dibatasi oleh proses manufaktur dan tidak diintegrasikan ke dalam chip, tetapi terintegrasi pada motherboard. L3 cache yang hanya bisa disinkronkan dengan frekuensi bus sistem sebenarnya tidak jauh berbeda dengan memori utama. Nantinya, cache L3 digunakan oleh prosesor Intel Itanium untuk pasar server. Lalu ada P4EE dan Xeon MP. Intel juga berencana meluncurkan prosesor Itanium2 dengan cache L3 9MB, dan kemudian prosesor Itanium2 dual-core dengan cache L3 24MB.
Namun pada dasarnya L3 cache tidak terlalu penting untuk meningkatkan kinerja prosesor. Misalnya saja prosesor Xeon MP yang dilengkapi dengan L3 cache 1MB masih belum bisa menandingi Opteron lebih efektif daripada peningkatan cache.
[Potong Halaman]
7. Set instruksi yang diperluas CPU
CPU mengandalkan instruksi untuk menghitung dan mengendalikan sistem. Setiap CPU dirancang dengan serangkaian sistem instruksi yang sesuai dengan sirkuit perangkat kerasnya. Kekuatan instruksi juga merupakan indikator penting dari CPU. Kumpulan instruksi adalah salah satu alat paling efektif untuk meningkatkan efisiensi mikroprosesor. Dari arsitektur arus utama saat ini, set instruksi dapat dibagi menjadi dua bagian: set instruksi kompleks dan set instruksi yang disederhanakan Dari perspektif aplikasi spesifik, seperti Intel MMX (Multi Media Extended), SSE, SSE2 (Streaming-Single instruction multiple). data -Extensions 2), SEE3 dan AMD's 3DNow! semuanya merupakan set instruksi tambahan dari CPU, yang masing-masing meningkatkan kemampuan pemrosesan multimedia, grafik, dan Internet dari CPU.
Kami biasanya menyebut kumpulan instruksi tambahan pada CPU sebagai "kumpulan instruksi CPU". Set instruksi SSE3 juga merupakan set instruksi terkecil saat ini. Sebelumnya, MMX berisi 57 perintah, SSE berisi 50 perintah, SSE2 berisi 144 perintah, dan SSE3 berisi 13 perintah. Saat ini, SSE3 juga merupakan set instruksi paling canggih. Prosesor Intel Prescott sudah mendukung set instruksi SSE3. AMD akan menambahkan dukungan untuk set instruksi SSE3 ke prosesor dual-core di masa depan.
8. Inti CPU dan tegangan operasi I/O
Mulai dari 586CPU, tegangan kerja CPU dibagi menjadi dua jenis: tegangan inti dan tegangan I/O. Biasanya tegangan inti CPU kurang dari atau sama dengan tegangan I/O. Besar kecilnya tegangan inti ditentukan berdasarkan proses produksi CPU. Umumnya, semakin kecil proses produksi, semakin rendah tegangan operasi inti umumnya 1,6~5V. Tegangan rendah dapat mengatasi masalah konsumsi daya yang berlebihan dan pembangkitan panas yang berlebihan.
9. Proses pembuatan
Mikron proses pembuatannya mengacu pada jarak antar rangkaian di dalam IC. Tren dalam proses manufaktur mengarah pada kepadatan yang lebih tinggi. Desain rangkaian IC dengan kepadatan lebih tinggi berarti IC dengan ukuran yang sama dapat memiliki desain rangkaian dengan kepadatan lebih tinggi dan fungsi yang lebih kompleks. Sekarang yang utama adalah 180nm, 130nm dan 90nm. Baru-baru ini, para pejabat menyatakan bahwa ada proses manufaktur 65nm.
10. Set instruksi
(1) set instruksi CISC
Set instruksi CISC, juga dikenal sebagai set instruksi kompleks, nama Inggrisnya CISC, (singkatan dari Complex instruction set computer). Dalam mikroprosesor CISC, setiap instruksi program dijalankan secara serial secara berurutan, dan operasi pada setiap instruksi juga dieksekusi secara serial secara berurutan. Keuntungan dari eksekusi sekuensial adalah kontrolnya yang sederhana, namun tingkat pemanfaatan berbagai bagian komputer tidak tinggi dan kecepatan eksekusinya lambat. Faktanya, ini adalah CPU seri x86 (yaitu, arsitektur IA-32) yang diproduksi oleh Intel dan CPU yang kompatibel, seperti AMD dan VIA. Bahkan X86-64 baru (juga disebut AMD64) termasuk dalam kategori CISC.
Untuk mengetahui apa itu set instruksi, kita harus mulai dengan CPU berarsitektur X86 saat ini. Set instruksi X86 dikembangkan secara khusus oleh Intel untuk CPU 16-bit pertamanya (i8086). CPU di PC pertama di dunia—i8088 (versi sederhana dari i8086) yang diluncurkan oleh IBM pada tahun 1981 juga menggunakan instruksi X86. komputer Chip X87 ditambahkan untuk meningkatkan kemampuan pemrosesan data floating-point. Mulai sekarang, set instruksi X86 dan set instruksi X87 akan secara kolektif disebut sebagai set instruksi X86.
Meskipun dengan perkembangan teknologi CPU yang berkelanjutan, Intel berturut-turut mengembangkan i80386 yang lebih baru, i80486, hingga PII Xeon, PIII Xeon, Pentium 3, dan terakhir hingga seri Pentium 4 saat ini, Xeon (tidak termasuk Xeon Nocona), tetapi untuk memastikan bahwa komputer dapat terus menjalankan berbagai aplikasi yang dikembangkan di masa lalu untuk melindungi dan mewarisi sumber daya perangkat lunak yang kaya, semua CPU yang diproduksi oleh Intel terus menggunakan set instruksi X86, sehingga CPU-nya masih termasuk dalam seri X86. Karena seri Intel X86 dan CPU yang kompatibel (seperti AMD Athlon MP,) semuanya menggunakan set instruksi X86, jajaran besar seri X86 dan CPU yang kompatibel saat ini telah terbentuk. x86CPU saat ini terutama mencakup CPU server Intel dan CPU server AMD.
(2) set instruksi RISC
RISC adalah singkatan dari "Reduksi Set Instruksi Komputasi" dalam bahasa Inggris, yang berarti "set instruksi yang dikurangi" dalam bahasa Cina. Ini dikembangkan berdasarkan sistem instruksi CISC. Seseorang menguji mesin CISC dan menunjukkan bahwa frekuensi penggunaan berbagai instruksi sangat berbeda. Instruksi yang paling umum digunakan adalah beberapa instruksi yang relatif sederhana, yang hanya mencakup 20% dari total instruksi jumlah total instruksi. Namun frekuensi kemunculannya dalam program mencapai 80%. Sistem instruksi yang kompleks pasti akan meningkatkan kompleksitas mikroprosesor, membuat pengembangan prosesor menjadi lama dan mahal. Dan instruksi yang rumit memerlukan operasi yang rumit, yang pasti akan mengurangi kecepatan komputer. Berdasarkan alasan di atas, CPU RISC lahir pada tahun 1980-an. Dibandingkan dengan CPU CISC, CPU RISC tidak hanya menyederhanakan sistem instruksi, tetapi juga mengadopsi sesuatu yang disebut "struktur superscalar dan super-pipeline", yang sangat meningkatkan kemampuan pemrosesan paralel.
Set instruksi RISC adalah arah pengembangan CPU berkinerja tinggi. Ini bertentangan dengan CISC (Set Instruksi Kompleks) tradisional. Sebagai perbandingan, RISC memiliki format instruksi terpadu, tipe yang lebih sedikit, dan metode pengalamatan yang lebih sedikit dibandingkan set instruksi yang kompleks. Tentu saja, kecepatan pemrosesannya meningkat pesat. Saat ini CPU dengan sistem instruksi ini biasa digunakan di server kelas menengah ke atas, terutama server kelas atas semuanya menggunakan CPU dengan sistem instruksi RISC. Sistem instruksi RISC lebih cocok untuk UNIX, sistem operasi server kelas atas. Sekarang Linux juga merupakan sistem operasi mirip UNIX. CPU tipe RISC tidak kompatibel dengan CPU Intel dan AMD dalam perangkat lunak dan perangkat keras.
Saat ini, CPU yang menggunakan instruksi RISC di server kelas menengah ke atas terutama mencakup kategori berikut: prosesor PowerPC, prosesor SPARC, prosesor PA-RISC, prosesor MIPS, dan prosesor Alpha.
(3)IA-64
Ada banyak perdebatan mengenai apakah EPIC (Explicitly Parallel instruction Computers) adalah penerus sistem RISC dan CISC. Dengan menggunakan sistem EPIC saja, ini lebih merupakan langkah penting bagi prosesor Intel untuk beralih ke sistem RISC. Secara teoritis, CPU yang dirancang oleh sistem EPIC dapat menangani perangkat lunak aplikasi Windows jauh lebih baik daripada perangkat lunak aplikasi berbasis Unix dalam konfigurasi host yang sama.
CPU server Intel yang menggunakan teknologi EPIC adalah Itanium (nama kode pengembangan: Merced). Ini adalah prosesor 64-bit dan yang pertama di seri IA-64. Microsoft juga telah mengembangkan sistem operasi dengan nama kode Win64 dan mendukungnya dalam perangkat lunak. Setelah Intel mengadopsi set tersebut, maka lahirlah arsitektur IA-64 yang menggunakan set instruksi EPIC. IA-64 merupakan peningkatan besar dibandingkan x86 dalam banyak aspek. Ini menerobos banyak keterbatasan arsitektur IA32 tradisional dan mencapai peningkatan terobosan dalam kemampuan pemrosesan data, stabilitas sistem, keamanan, kegunaan, dan rasionalitas yang cukup besar.
Kelemahan terbesar mikroprosesor IA-64 adalah kurangnya kompatibilitas dengan x86. Agar prosesor Intel IA-64 dapat menjalankan perangkat lunak dari dua generasi dengan lebih baik, ia telah menggunakan prosesor IA-64 (Itanium, Itanium2... ) memperkenalkan x86. -decoder ke-IA-64, yang dapat menerjemahkan instruksi x86 menjadi instruksi IA-64. Decoder ini bukanlah decoder yang paling efisien, juga bukan cara terbaik untuk menjalankan kode x86 (cara terbaik adalah dengan menjalankan kode x86 langsung pada prosesor x86), sehingga kinerja Itanium dan Itanium2 saat menjalankan aplikasi x86 Sangat buruk. Hal ini pula yang menjadi alasan mendasar munculnya X86-64.
(4)X86-64 (AMD64 / EM64T)
Dirancang oleh AMD, ia dapat menangani operasi integer 64-bit secara bersamaan dan kompatibel dengan arsitektur X86-32. Ini mendukung pengalamatan logis 64-bit dan menyediakan opsi untuk mengonversi ke pengalamatan 32-bit; namun, instruksi operasi data defaultnya adalah 32-bit dan 8-bit, dan menyediakan opsi untuk mengonversi ke 64-bit dan 16-bit; mendukung register tujuan umum, jika operasi 32-bit, hasilnya perlu diperluas hingga 64 bit lengkap. Dengan cara ini, terdapat perbedaan antara "eksekusi langsung" dan "eksekusi konversi" dalam instruksi. Bidang instruksi adalah 8 bit atau 32 bit, sehingga bidang tersebut tidak terlalu panjang.
Penciptaan x86-64 (juga disebut AMD64) bukannya tidak berdasar. Ruang pengalamatan 32-bit pada prosesor x86 dibatasi pada memori 4GB, dan prosesor IA-64 tidak kompatibel dengan x86. AMD sepenuhnya mempertimbangkan kebutuhan pelanggan dan meningkatkan fungsi set instruksi x86 sehingga set instruksi ini dapat mendukung mode komputasi 64-bit secara bersamaan. Oleh karena itu, AMD menyebut strukturnya x86-64. Secara teknis, untuk melakukan operasi 64-bit dalam arsitektur x86-64, AMD telah memperkenalkan register tujuan umum R8-R15 baru sebagai perluasan dari register Gunakan ini yang asli. Register asli seperti EAX dan EBX juga telah diperluas dari 32 bit menjadi 64 bit. Delapan register baru telah ditambahkan ke unit SSE untuk memberikan dukungan bagi SSE2. Peningkatan jumlah register akan menyebabkan peningkatan kinerja. Pada saat yang sama, untuk mendukung kode dan register 32- dan 64-bit, arsitektur x86-64 memungkinkan prosesor bekerja dalam dua mode berikut: Mode Panjang (mode panjang) dan Mode Lama (mode genetik). Mode panjang dibagi menjadi dua sub-mode: Mode (mode 64bit dan mode Kompatibilitas). Standar ini telah diperkenalkan pada prosesor server Opteron AMD.
Tahun ini juga diluncurkan teknologi EM64T yang mendukung 64-bit. Sebelum resmi bernama EM64T, itu adalah IA32E. Ini adalah nama teknologi ekstensi 64-bit Intel untuk membedakan set instruksi X86. EM64T Intel mendukung sub-mode 64-bit, yang mirip dengan teknologi AMD X86-64. Ia menggunakan pengalamatan bidang linier 64-bit, menambahkan 8 register tujuan umum (GPR) baru, dan menambahkan 8 register untuk mendukung instruksi SSE. Mirip dengan AMD, teknologi 64-bit milik Intel akan kompatibel dengan IA32 dan IA32E hanya akan digunakan saat menjalankan sistem operasi 64-bit. IA32E akan terdiri dari 2 sub-mode: sub-mode 64-bit dan sub-mode 32-bit, yang kompatibel dengan AMD64. EM64T Intel akan sepenuhnya kompatibel dengan teknologi AMD X86-64. Kini prosesor Nocona telah menambahkan beberapa teknologi 64-bit, dan prosesor Intel Pentium 4E juga mendukung teknologi 64-bit.
Harus dikatakan bahwa keduanya adalah arsitektur mikroprosesor 64-bit yang kompatibel dengan set instruksi x86, tetapi masih ada beberapa perbedaan antara EM64T dan AMD64. Bit NX pada prosesor AMD64 tidak akan disediakan di prosesor Intel.
11. Superpipeline dan superscalar
Sebelum menjelaskan superpipeline dan superscalar, mari kita pahami dulu pipeline. Pipeline ini pertama kali digunakan oleh Intel pada chip 486. Jalur perakitan bekerja seperti jalur perakitan dalam produksi industri. Di dalam CPU, pipa pemrosesan instruksi terdiri dari 5-6 unit sirkuit dengan fungsi berbeda, kemudian instruksi X86 dibagi menjadi 5-6 langkah dan kemudian dieksekusi oleh unit sirkuit tersebut masing-masing, sehingga satu instruksi dapat diselesaikan dalam satu Siklus jam CPU. , sehingga meningkatkan kecepatan komputasi CPU. Setiap pipa bilangan bulat Pentium klasik dibagi menjadi empat tingkat pipa, yaitu pengambilan instruksi, decoding, eksekusi, dan penulisan kembali hasil. Pipa floating point dibagi menjadi delapan tingkat pipa.
Superscalar menggunakan beberapa pipeline bawaan untuk mengeksekusi beberapa prosesor secara bersamaan. Pipa super adalah menyelesaikan satu atau lebih operasi dalam satu siklus mesin dengan menyempurnakan pipa dan meningkatkan frekuensi utama. Esensinya adalah menukar waktu dengan ruang. Misalnya, pipeline Pentium 4 sepanjang 20 tahap. Semakin panjang langkah-langkah (tahapan) pipeline yang dirancang, semakin cepat ia dapat menyelesaikan suatu instruksi, sehingga dapat beradaptasi dengan CPU dengan frekuensi operasi yang lebih tinggi. Namun, pipeline yang terlalu panjang juga membawa efek samping tertentu. Kemungkinan besar kecepatan komputasi sebenarnya dari CPU dengan frekuensi yang lebih tinggi akan lebih rendah. Hal ini terjadi pada Intel Pentium 4, meskipun frekuensi utamanya bisa sama tinggi 1.4G atau lebih, tetapi kinerja komputasinya jauh kalah dengan AMD 1.2G Athlon atau bahkan Pentium III.
12. Bentuk paket
Pengemasan CPU adalah tindakan perlindungan yang menggunakan bahan tertentu untuk memadatkan chip CPU atau modul CPU di dalamnya untuk mencegah kerusakan. Umumnya, CPU harus dikemas sebelum dapat dikirimkan ke pengguna. Metode pengemasan CPU bergantung pada bentuk instalasi CPU dan desain integrasi perangkat. Dari sudut pandang klasifikasi yang luas, CPU biasanya dipasang menggunakan soket Socket yang dikemas menggunakan PGA (grid array), sedangkan CPU yang dipasang menggunakan slot Slot x semuanya dikemas menggunakan PGA (grid array). menggunakan bentuk kemasan SEC (Single-Sided Junction Box). Ada juga teknologi pengemasan seperti PLGA (Plastic Land Grid Array) dan OLGA (Organic Land Grid Array). Karena persaingan pasar yang semakin ketat, arah pengembangan teknologi pengemasan CPU saat ini terutama adalah penghematan biaya.
7. Set instruksi yang diperluas CPU
CPU mengandalkan instruksi untuk menghitung dan mengendalikan sistem. Setiap CPU dirancang dengan serangkaian sistem instruksi yang sesuai dengan sirkuit perangkat kerasnya. Kekuatan instruksi juga merupakan indikator penting dari CPU. Kumpulan instruksi adalah salah satu alat paling efektif untuk meningkatkan efisiensi mikroprosesor. Dari arsitektur arus utama saat ini, set instruksi dapat dibagi menjadi dua bagian: set instruksi kompleks dan set instruksi yang disederhanakan Dari perspektif aplikasi spesifik, seperti Intel MMX (Multi Media Extended), SSE, SSE2 (Streaming-Single instruction multiple). data -Extensions 2), SEE3 dan AMD's 3DNow! semuanya merupakan set instruksi tambahan dari CPU, yang masing-masing meningkatkan kemampuan pemrosesan multimedia, grafik, dan Internet dari CPU.
Kami biasanya menyebut kumpulan instruksi tambahan pada CPU sebagai "kumpulan instruksi CPU". Set instruksi SSE3 juga merupakan set instruksi terkecil saat ini. Sebelumnya, MMX berisi 57 perintah, SSE berisi 50 perintah, SSE2 berisi 144 perintah, dan SSE3 berisi 13 perintah. Saat ini, SSE3 juga merupakan set instruksi paling canggih. Prosesor Intel Prescott sudah mendukung set instruksi SSE3. AMD akan menambahkan dukungan untuk set instruksi SSE3 ke prosesor dual-core di masa depan.
8. Inti CPU dan tegangan operasi I/O
Mulai dari 586CPU, tegangan kerja CPU dibagi menjadi dua jenis: tegangan inti dan tegangan I/O. Biasanya tegangan inti CPU kurang dari atau sama dengan tegangan I/O. Besar kecilnya tegangan inti ditentukan berdasarkan proses produksi CPU. Umumnya, semakin kecil proses produksi, semakin rendah tegangan operasi inti umumnya 1,6~5V. Tegangan rendah dapat mengatasi masalah konsumsi daya yang berlebihan dan pembangkitan panas yang berlebihan.
9. Proses pembuatan
Mikron proses pembuatannya mengacu pada jarak antar rangkaian di dalam IC. Tren dalam proses manufaktur mengarah pada kepadatan yang lebih tinggi. Desain rangkaian IC dengan kepadatan lebih tinggi berarti IC dengan ukuran yang sama dapat memiliki desain rangkaian dengan kepadatan lebih tinggi dan fungsi yang lebih kompleks. Sekarang yang utama adalah 180nm, 130nm dan 90nm. Baru-baru ini, para pejabat menyatakan bahwa ada proses manufaktur 65nm.
10. Set instruksi
(1) set instruksi CISC
Set instruksi CISC, juga dikenal sebagai set instruksi kompleks, nama Inggrisnya CISC, (singkatan dari Complex instruction set computer). Dalam mikroprosesor CISC, setiap instruksi program dijalankan secara serial secara berurutan, dan operasi pada setiap instruksi juga dieksekusi secara serial secara berurutan. Keuntungan dari eksekusi sekuensial adalah kontrolnya yang sederhana, namun tingkat pemanfaatan berbagai bagian komputer tidak tinggi dan kecepatan eksekusinya lambat. Faktanya, ini adalah CPU seri x86 (yaitu, arsitektur IA-32) yang diproduksi oleh Intel dan CPU yang kompatibel, seperti AMD dan VIA. Bahkan X86-64 baru (juga disebut AMD64) termasuk dalam kategori CISC.
Untuk mengetahui apa itu set instruksi, kita harus mulai dengan CPU berarsitektur X86 saat ini. Set instruksi X86 dikembangkan secara khusus oleh Intel untuk CPU 16-bit pertamanya (i8086). CPU di PC pertama di dunia—i8088 (versi sederhana dari i8086) yang diluncurkan oleh IBM pada tahun 1981 juga menggunakan instruksi X86. komputer Chip X87 ditambahkan untuk meningkatkan kemampuan pemrosesan data floating-point. Mulai sekarang, set instruksi X86 dan set instruksi X87 akan secara kolektif disebut sebagai set instruksi X86.
Meskipun dengan perkembangan teknologi CPU yang berkelanjutan, Intel berturut-turut mengembangkan i80386 yang lebih baru, i80486, hingga PII Xeon, PIII Xeon, Pentium 3, dan terakhir hingga seri Pentium 4 saat ini, Xeon (tidak termasuk Xeon Nocona), tetapi untuk memastikan bahwa komputer dapat terus menjalankan berbagai aplikasi yang dikembangkan di masa lalu untuk melindungi dan mewarisi sumber daya perangkat lunak yang kaya, semua CPU yang diproduksi oleh Intel terus menggunakan set instruksi X86, sehingga CPU-nya masih termasuk dalam seri X86. Karena seri Intel X86 dan CPU yang kompatibel (seperti AMD Athlon MP,) semuanya menggunakan set instruksi X86, jajaran besar seri X86 dan CPU yang kompatibel saat ini telah terbentuk. x86CPU saat ini terutama mencakup CPU server Intel dan CPU server AMD.
(2) set instruksi RISC
RISC adalah singkatan dari "Reduksi Set Instruksi Komputasi" dalam bahasa Inggris, yang berarti "set instruksi yang dikurangi" dalam bahasa Cina. Ini dikembangkan berdasarkan sistem instruksi CISC. Seseorang menguji mesin CISC dan menunjukkan bahwa frekuensi penggunaan berbagai instruksi sangat berbeda. Instruksi yang paling umum digunakan adalah beberapa instruksi yang relatif sederhana, yang hanya mencakup 20% dari total instruksi jumlah total instruksi. Namun frekuensi kemunculannya dalam program mencapai 80%. Sistem instruksi yang kompleks pasti akan meningkatkan kompleksitas mikroprosesor, membuat pengembangan prosesor menjadi lama dan mahal. Dan instruksi yang rumit memerlukan operasi yang rumit, yang pasti akan mengurangi kecepatan komputer. Berdasarkan alasan di atas, CPU RISC lahir pada tahun 1980-an. Dibandingkan dengan CPU CISC, CPU RISC tidak hanya menyederhanakan sistem instruksi, tetapi juga mengadopsi sesuatu yang disebut "struktur superscalar dan super-pipeline", yang sangat meningkatkan kemampuan pemrosesan paralel.
Set instruksi RISC adalah arah pengembangan CPU berkinerja tinggi. Ini bertentangan dengan CISC (Set Instruksi Kompleks) tradisional. Sebagai perbandingan, RISC memiliki format instruksi terpadu, tipe yang lebih sedikit, dan metode pengalamatan yang lebih sedikit dibandingkan set instruksi yang kompleks. Tentu saja, kecepatan pemrosesannya meningkat pesat. Saat ini CPU dengan sistem instruksi ini biasa digunakan di server kelas menengah ke atas, terutama server kelas atas semuanya menggunakan CPU dengan sistem instruksi RISC. Sistem instruksi RISC lebih cocok untuk UNIX, sistem operasi server kelas atas. Sekarang Linux juga merupakan sistem operasi mirip UNIX. CPU tipe RISC tidak kompatibel dengan CPU Intel dan AMD dalam perangkat lunak dan perangkat keras.
Saat ini, CPU yang menggunakan instruksi RISC di server kelas menengah ke atas terutama mencakup kategori berikut: prosesor PowerPC, prosesor SPARC, prosesor PA-RISC, prosesor MIPS, dan prosesor Alpha.
(3)IA-64
Ada banyak perdebatan mengenai apakah EPIC (Explicitly Parallel instruction Computers) adalah penerus sistem RISC dan CISC. Dengan menggunakan sistem EPIC saja, ini lebih merupakan langkah penting bagi prosesor Intel untuk beralih ke sistem RISC. Secara teoritis, CPU yang dirancang oleh sistem EPIC dapat menangani perangkat lunak aplikasi Windows jauh lebih baik daripada perangkat lunak aplikasi berbasis Unix dalam konfigurasi host yang sama.
CPU server Intel yang menggunakan teknologi EPIC adalah Itanium (nama kode pengembangan: Merced). Ini adalah prosesor 64-bit dan yang pertama di seri IA-64. Microsoft juga telah mengembangkan sistem operasi dengan nama kode Win64 dan mendukungnya dalam perangkat lunak. Setelah Intel mengadopsi set, sehingga arsitektur IA-64 menggunakan set instruksi epik lahir. IA-64 adalah peningkatan besar dibandingkan x86 dalam banyak aspek. Ini menembus banyak keterbatasan arsitektur IA32 tradisional dan mencapai peningkatan terobosan dalam kemampuan pemrosesan data, stabilitas sistem, keamanan, kegunaan, dan rasionalitas yang cukup besar.
Kelemahan terbesar mikroprosesor IA-64 adalah kurangnya kompatibilitas mereka dengan x86. -to-IA-64 Decoder, yang dapat menerjemahkan instruksi x86 ke dalam instruksi IA-64. Decoder ini bukan decoder yang paling efisien, juga bukan cara terbaik untuk menjalankan kode x86 (cara terbaik adalah menjalankan kode x86 secara langsung pada prosesor x86), sehingga kinerja Itanium dan Itanium2 saat menjalankan aplikasi x86 sangat buruk. Ini juga menjadi alasan mendasar untuk munculnya x86-64.
(4) x86-64 (AMD64 / EM64T)
Dirancang oleh AMD, dapat menangani operasi integer 64-bit secara bersamaan dan kompatibel dengan arsitektur X86-32. Ini mendukung pengalamatan logis 64-bit dan memberikan opsi untuk mengonversi ke pengalamatan 32-bit; Mendukung register tujuan umum, jika itu adalah operasi 32-bit, perlu untuk memperluas hasilnya menjadi 64 bit lengkap. Dengan cara ini, ada perbedaan antara "eksekusi langsung" dan "eksekusi konversi" dalam instruksi.
Penciptaan x86-64 (juga disebut AMD64) tidak tidak berdasar. AMD sepenuhnya mempertimbangkan kebutuhan pelanggan dan meningkatkan fungsi set instruksi x86 sehingga set instruksi ini dapat mendukung mode komputasi 64-bit pada saat yang sama. Secara teknis, untuk melakukan operasi 64-bit dalam arsitektur X86-64, AMD telah memperkenalkan register tujuan umum R8-R15 baru sebagai perluasan dari penggunaan asli register ini. Register asli seperti EAX dan EBX juga telah diperluas dari 32 bit menjadi 64 bit. Delapan register baru telah ditambahkan ke unit SSE untuk memberikan dukungan untuk SSE2. Peningkatan jumlah register akan menyebabkan peningkatan kinerja. Pada saat yang sama, untuk mendukung kode dan register 32 dan 64-bit, arsitektur X86-64 memungkinkan prosesor untuk bekerja dalam dua mode berikut: mode panjang (mode panjang) dan mode warisan (mode genetik). Mode panjang dibagi menjadi dua sub-mode: mode (mode 64bit dan mode kompatibilitas). Standar ini telah diperkenalkan dalam prosesor Opteron Server AMD.
Tahun ini, teknologi EM64T yang mendukung 64-bit juga diluncurkan. Intel EM64T mendukung sub-mode 64-bit, yang mirip dengan teknologi X86-64 AMD. Mirip dengan AMD, teknologi 64-bit Intel akan kompatibel dengan IA32 dan IA32E. IA32E akan terdiri dari 2 sub-mode: sub-mode 64-bit dan sub-mode 32-bit, yang kompatibel dengan AMD64. Intel's Em64T akan sepenuhnya kompatibel dengan teknologi X86-64 AMD. Sekarang prosesor Nocona telah menambahkan beberapa teknologi 64-bit, dan prosesor Intel Pentium 4E juga mendukung teknologi 64-bit.
Harus dikatakan bahwa keduanya adalah arsitektur mikroprosesor 64-bit yang kompatibel dengan set instruksi X86, tetapi masih ada beberapa perbedaan antara EM64T dan AMD64.
11. Superpipeline dan Superscalar
Sebelum menjelaskan Superpipeline dan Superscalar, mari kita pahami pipa. Pipa ini pertama kali digunakan oleh Intel dalam chip 486. Jalur perakitan berfungsi seperti jalur perakitan dalam produksi industri. Dalam CPU, pipa pemrosesan instruksi terdiri dari 5-6 unit sirkuit dengan fungsi yang berbeda, dan kemudian instruksi x86 dibagi menjadi 5-6 langkah dan kemudian dieksekusi oleh unit sirkuit ini masing-masing, sehingga satu instruksi dapat diselesaikan dalam satu Siklus clock CPU., Dengan demikian meningkatkan kecepatan komputasi CPU. Setiap pipa integer dari Pentium klasik dibagi menjadi empat tingkat pipa, yaitu prefetching instruksi, decoding, eksekusi, dan menulis hasil belakang.
SuperScalar menggunakan banyak pipa bawaan untuk menjalankan beberapa prosesor secara bersamaan. Pipa super adalah untuk menyelesaikan satu atau lebih operasi dalam satu siklus mesin dengan menyempurnakan pipa dan meningkatkan frekuensi utama. Misalnya, pipa Pentium 4 adalah selama 20 tahap. Semakin lama langkah (tahap) pipa dirancang, semakin cepat dapat menyelesaikan instruksi, sehingga dapat beradaptasi dengan CPU dengan frekuensi operasi yang lebih tinggi. Namun, pipa yang terlalu panjang juga membawa efek samping tertentu. 1.4g atau lebih.
12. Formulir Paket
Kemasan CPU adalah ukuran pelindung yang menggunakan bahan spesifik untuk memperkuat modul CPU atau modul CPU di dalamnya untuk mencegah kerusakan. Metode pengemasan CPU tergantung pada formulir instalasi CPU dan desain integrasi perangkat. Menggunakan bentuk kemasan SEC (satu sisi persimpangan). Ada juga teknologi pengemasan seperti PLGA (array grid lahan plastik) dan OLGA (array jaringan lahan organik). Karena persaingan pasar yang semakin sengit, arah pengembangan teknologi pengemasan CPU saat ini terutama penghematan biaya.