1. Частота процессора сервера
Основная частота серверного процессора также называется тактовой частотой. Единица измерения — МГц и используется для обозначения скорости вычислений ЦП. Основная частота процессора = FSB × коэффициент умножения. Многие думают, что основная частота определяет скорость работы ЦП. Это не только однобоко, но и для серверов это понимание тоже предвзятое. До сих пор не существует определенной формулы, которая могла бы определить числовую зависимость между основной частотой и фактической скоростью вычислений. Даже у двух крупнейших производителей процессоров Intel и AMD есть большие споры по этому поводу. Начнем с Intel. Рассматривая тенденции развития продуктов. , видно, что Intel придает большое значение усилению развития собственной основной частоты. Как и у других производителей процессоров, кто-то однажды сравнил его с процессором Transmeta 1G. Его эффективность работы эквивалентна процессору Intel 2G.
Следовательно, основная частота ЦП не связана напрямую с фактической вычислительной мощностью ЦП. Основная частота указывает скорость генерации цифрового импульсного сигнала в ЦП. Мы также можем видеть примеры этого в процессорных продуктах Intel: чипы Itanium с частотой 1 ГГц могут работать почти так же быстро, как Xeon/Opteron с частотой 2,66 ГГц, или Itanium 2 с частотой 1,5 ГГц примерно так же быстро, как Xeon/Opteron с частотой 4 ГГц. Скорость вычислений ЦП также зависит от показателей производительности различных аспектов конвейера ЦП.
Конечно, основная частота связана с фактической скоростью вычислений. Можно только сказать, что основная частота является лишь одним из аспектов производительности ЦП и не отражает общую производительность ЦП.
2. Частота внешней шины сервера (FSB)
Частота внешней шины (FSB) (т.е. частота шины) напрямую влияет на скорость прямого обмена данными между ЦП и памятью. Существует формула, которую можно рассчитать: полоса пропускания данных = (частота шины × полоса пропускания данных)/8. Максимальная полоса пропускания передачи данных зависит от ширины и частоты передачи всех данных, передаваемых одновременно. Например, нынешний Xeon Nocona, поддерживающий 64-разрядную систему, имеет частоту внешней шины 800 МГц. Согласно формуле, его максимальная пропускная способность передачи данных составляет 6,4 ГБ/сек.
Разница между частотой FSB и частотой FSB: Скорость FSB относится к скорости передачи данных, а FSB — это скорость синхронной работы между процессором и материнской платой. Другими словами, FSB 100 МГц относится к цифровому импульсному сигналу, генерирующему десять миллионов раз в секунду, тогда как внешняя шина 100 МГц относится к объему передачи данных, который ЦП может принять в секунду, что составляет 100 МГц × 64 бита ÷ 8 байт; /бит=800МБ/с.
Фактически, появление архитектуры «HyperTransport» изменило реальную частоту внешней шины (FSB). Ранее мы знали, что архитектура IA-32 должна состоять из трех важных компонентов: концентратора контроллера памяти (MCH), концентратора контроллера ввода-вывода и концентратора PCI, таких как типичные наборы микросхем Intel 7501 и Intel7505, которые представляют собой два процессора Xeon. Содержащийся в них MCH обеспечивает процессору частоту внешней шины 533 МГц. При использовании памяти DDR пропускная способность внешней шины может достигать 4,3 ГБ/сек.
Однако по мере того, как производительность процессора продолжает улучшаться, это также приносит много проблем в системную архитектуру. Архитектура «HyperTransport» не только решает проблему, но и более эффективно повышает пропускную способность шины, как, например, в процессорах AMD Opteron. Гибкая архитектура шины ввода-вывода HyperTransport позволяет интегрировать контроллер памяти, чтобы процессор не передавал данные. через системную шину чипсет обменивается данными напрямую с памятью. В данном случае я не знаю, с чего начать разговор о частоте внешней шины (FSB) в процессорах AMD Opteron.
3. Процессор ФСБ
FSB — это базовая частота процессора, ее единица также равна МГц. FSB процессора определяет скорость работы всей материнской платы. Грубо говоря, в настольных компьютерах то, что мы называем разгоном, означает разгон FSB процессора (конечно, в нормальных условиях множитель процессора заблокирован, я думаю, это хорошо понятно). А вот для серверных процессоров разгон категорически запрещен. Как упоминалось ранее, процессор определяет скорость работы материнской платы. Они работают синхронно. Если процессор сервера разогнан и изменена FSB, произойдет асинхронная работа (многие материнские платы для настольных ПК поддерживают асинхронную работу). сервер работает асинхронно. Нестабильность системы.
В большинстве современных компьютерных систем FSB также обеспечивает синхронную скорость работы между памятью и материнской платой. Таким образом, можно понять, что FSB процессора напрямую подключена к памяти для достижения синхронного состояния работы между ними. Легко спутать FSB и частоту FSB. Давайте поговорим о разнице между ними в следующем вступлении к FSB.
4. Разрядность процессора и длина слова
Бит: двоичный код используется в цифровых схемах и компьютерных технологиях, а коды — это только «0» и «1». Является ли «0» или «1» «битом» в ЦП.
Длина слова: В компьютерных технологиях количество двоичных цифр, которые ЦП может обрабатывать одновременно в единицу времени (одновременно), называется длиной слова. Поэтому процессор, который может обрабатывать данные с длиной слова 8 бит, обычно называют 8-битным процессором. Точно так же 32-битный ЦП может обрабатывать двоичные данные длиной слова 32 бита в единицу времени. Разница между длиной байта и длиной слова: поскольку часто используемые английские символы могут быть представлены 8-битным двоичным кодом, 8 бит обычно называются байтом. Длина слова не фиксирована, и длина слова различна для разных процессоров. 8-битный процессор может обрабатывать только один байт за раз, а 32-битный процессор может обрабатывать 4 байта за раз. Аналогично, 64-битный процессор может обрабатывать 8 байтов за раз.
5. Коэффициент умножения частоты
Коэффициент умножения относится к относительному пропорциональному соотношению между основной частотой процессора и FSB. При той же FSB, чем выше множитель частоты, тем выше частота процессора. Но на самом деле, в условиях той же FSB, сам по себе процессор с высоким множителем не имеет большого значения. Это связано с тем, что скорость передачи данных между ЦП и системой ограничена. ЦП, который слепо гонится за высокими множителями и получает высокую основную частоту, будет иметь очевидный эффект «узкого места» — максимальную скорость, с которой ЦП получает данные из системы. не может удовлетворить требования к скорости вычислений процессора. Вообще говоря, за исключением инженерных образцов, у процессоров Intel множители заблокированы, но AMD их раньше не блокировала.
6.Кэш процессора
Размер кэша также является одним из важных показателей процессора, а структура и размер кэша оказывают большое влияние на скорость процессора. Кэш в процессоре работает с чрезвычайно высокой частотой и обычно работает на той же частоте, что и процессор. процессор, и его эффективность работы намного выше, чем у системной памяти и жесткого диска. В реальной работе ЦП часто приходится неоднократно читать один и тот же блок данных, а увеличение емкости кэша может значительно повысить скорость чтения данных внутри ЦП без необходимости поиска их в памяти или на жестком диске, тем самым улучшая систему. производительность. . Однако из-за таких факторов, как площадь чипа ЦП и стоимость, кэш очень мал.
Кэш L1 (кэш первого уровня) — это кеш первого уровня ЦП, который разделен на кеш данных и кеш инструкций. Емкость и структура встроенного кэша L1 оказывают большее влияние на производительность ЦП. Однако кэш-память состоит из статического ОЗУ и имеет сложную структуру. Когда площадь кристалла ЦП не может быть слишком большой, емкость. кэша L1 недостаточно. Вероятно, он сделан слишком большим. Емкость кэша L1 обычного серверного процессора обычно составляет 32–256 КБ.
Кэш L2 (кэш второго уровня) — это кеш второго уровня ЦП, который разделен на внутренние и внешние чипы. Внутренний кэш L2 на кристалле работает на той же частоте, что и основная частота, тогда как внешний кэш L2 работает только на половине основной частоты. Емкость кэша L2 также влияет на производительность ЦП. Принцип заключается в том, что чем больше, тем лучше. Наибольшая емкость текущего домашнего ЦП составляет 512 КБ, а кэш-память L2 ЦП на серверах и рабочих станциях достигает 256 КБ. 1 МБ, а некоторые достигают 2 или 3 МБ.
Кэш L3 (трехуровневый кеш) делится на два типа: ранний был внешним, а нынешние — встроенным. Фактический эффект заключается в том, что применение кэша L3 может еще больше снизить задержку памяти и повысить производительность процессора при расчете больших объемов данных. Уменьшение задержки памяти и улучшение вычислительных возможностей больших данных полезны для игр. Что касается серверов, добавление кэша L3 по-прежнему обеспечивает значительное улучшение производительности. Например, конфигурация с большим кэшем L3 будет более эффективно использовать физическую память, поэтому она сможет обрабатывать больше запросов данных, чем более медленная дисковая подсистема ввода-вывода. Процессоры с более крупными кэшами L3 обеспечивают более эффективное поведение кэша файловой системы и более короткую длину сообщений и очередей процессора.
Фактически, самый ранний кэш L3 был применен в процессоре K6-III, выпущенном AMD. Кэш L3 в то время был ограничен производственным процессом и не был интегрирован в чип, а был встроен в материнскую плату. Кэш L3, синхронизировать который можно только с частотой системной шины, на самом деле мало чем отличается от основной памяти. Позже кэш L3 использовался процессором Intel Itanium для рынка серверов. Затем есть P4EE и Xeon MP. Intel также планирует выпустить процессор Itanium2 с 9 МБ кэш-памяти L3, а затем двухъядерный процессор Itanium2 с 24 МБ кэш-памяти L3.
Но в принципе кэш L3 не очень важен для повышения производительности процессора. Например, процессор Xeon MP, оснащенный кэшем L3 объемом 1 МБ, все еще не является противником Opteron. Видно, что увеличение внешней шины. более эффективно, чем увеличение производительности кэша.
[Вырезанная страница]
7. Расширенный набор инструкций ЦП.
ЦП использует инструкции для расчета и управления системой. Каждый ЦП имеет ряд систем инструкций, соответствующих его аппаратным схемам. Надежность инструкций также является важным показателем ЦП. Набор инструкций — один из наиболее эффективных инструментов повышения эффективности микропроцессоров. В современной основной архитектуре набор инструкций можно разделить на две части: сложный набор команд и упрощенный набор команд. С точки зрения конкретных приложений, таких как Intel MMX (Multi Media Extended), SSE, SSE2 (потоковая передача с несколькими командами). data-Extensions 2), SEE3 и AMD 3DNow! — это расширенные наборы инструкций ЦП, которые соответственно расширяют возможности ЦП по обработке мультимедиа, графики и Интернета.
Мы обычно называем расширенный набор команд ЦП «набором инструкций ЦП». Набор инструкций SSE3 также является самым маленьким набором команд на данный момент. Раньше MMX содержал 57 команд, SSE — 50 команд, SSE2 — 144 команды, а SSE3 — 13 команд. В настоящее время SSE3 также является самым продвинутым набором инструкций. Процессоры Intel Prescott уже поддерживают набор инструкций SSE3. AMD добавит поддержку набора инструкций SSE3 в будущие двухъядерные процессоры Transmeta.
8. Ядро ЦП и рабочее напряжение ввода-вывода
Начиная с 586CPU, рабочее напряжение ЦП делится на два типа: напряжение ядра и напряжение ввода-вывода. Обычно напряжение ядра ЦП меньше или равно напряжению ввода-вывода. Величина напряжения ядра определяется в зависимости от производственного процесса ЦП. Как правило, чем меньше производственный процесс, тем ниже рабочее напряжение ввода-вывода обычно составляет 1,6–5 В; Низкое напряжение может решить проблемы чрезмерного энергопотребления и чрезмерного выделения тепла.
9. Процесс изготовления
Микрон производственного процесса относится к расстоянию между цепями внутри ИС. Тенденция в производственных процессах направлена на повышение плотности. Конструкция схем ИС с более высокой плотностью означает, что ИС одного и того же размера могут иметь схемы с более высокой плотностью и более сложными функциями. Сейчас основными являются 180нм, 130нм и 90нм. Недавно официальные лица заявили, что существует 65-нм производственный процесс.
10. Набор инструкций
(1)Набор инструкций CISC
Набор инструкций CISC, также известный как комплексный набор команд, английское название CISC (аббревиатура компьютера с комплексным набором инструкций). В микропроцессоре CISC каждая инструкция программы выполняется последовательно по порядку, и операции в каждой инструкции также выполняются последовательно по порядку. Преимущество последовательного выполнения заключается в простоте управления, однако коэффициент использования различных частей компьютера невысокий и скорость выполнения низкая. Фактически, это процессор серии x86 (то есть архитектура IA-32) производства Intel и совместимые с ним процессоры, такие как AMD и VIA. Даже новый X86-64 (также называемый AMD64) относится к категории CISC.
Чтобы понять, что такое набор команд, нам нужно начать с современного процессора с архитектурой X86. Набор инструкций X86 был специально разработан Intel для своего первого 16-разрядного процессора (i8086). Процессор первого в мире ПК — i8088 (упрощенная версия i8086), выпущенного IBM в 1981 году, также использовал инструкции X86. В компьютер Чип X87 был добавлен для улучшения возможностей обработки данных с плавающей запятой. С этого момента набор команд X86 и набор команд X87 будут вместе называться набором команд X86.
Несмотря на постоянное развитие технологии ЦП, Intel последовательно разработала новые модели i80386, i80486, вплоть до прошлых PII Xeon, PIII Xeon, Pentium 3 и, наконец, до сегодняшней серии Pentium 4, Xeon (за исключением Xeon Nocona), но для того, чтобы Чтобы гарантировать, что компьютер может продолжать запускать различные приложения, разработанные в прошлом, для защиты и наследования богатых программных ресурсов, все процессоры, производимые Intel, продолжают использовать набор команд X86, поэтому их процессоры по-прежнему относятся к серии X86. Поскольку все процессоры серии Intel X86 и совместимые с ними процессоры (например, AMD Athlon MP) используют набор инструкций X86, на сегодняшний день сформировалась огромная линейка процессоров серии X86 и совместимых процессоров. Процессор x86 в настоящее время в основном включает в себя серверные процессоры Intel и серверные процессоры AMD.
(2)Набор инструкций RISC
RISC — это аббревиатура от «Вычисления с сокращенным набором команд» на английском языке, что на китайском означает «сокращенный набор команд». Он был разработан на основе системы инструкций CISC. Кто-то протестировал машину CISC и показал, что частота использования различных инструкций сильно различается. Наиболее часто используемые инструкции — это относительно простые инструкции, на которые приходится лишь 20% инструкций. общее количество инструкций, но частота встречаемости в программе составляет 80%. Сложная система команд неизбежно приведет к увеличению сложности микропроцессора, что сделает разработку процессора длительной и дорогостоящей. А сложные инструкции требуют сложных операций, что неизбежно приведет к снижению скорости компьютера. По вышеуказанным причинам процессоры RISC появились в 1980-х годах. По сравнению с процессорами CISC, процессоры RISC не только упростили систему инструкций, но также приняли нечто, называемое «суперскалярной и суперконвейерной структурой», что значительно увеличило возможности параллельной обработки.
Набор инструкций RISC — это направление развития высокопроизводительных процессоров. Это противоположность традиционному CISC (сложному набору инструкций). Для сравнения, RISC имеет унифицированный формат инструкций, меньше типов и меньше методов адресации, чем сложные наборы команд. Конечно, скорость обработки значительно увеличивается. В настоящее время процессоры с этой системой инструкций обычно используются в серверах среднего и высокого класса, особенно на серверах высокого класса, которые используют процессоры с системой инструкций RISC. Система инструкций RISC больше подходит для UNIX, операционной системы высокопроизводительных серверов. Теперь Linux также является UNIX-подобной операционной системой. Процессоры типа RISC несовместимы с процессорами Intel и AMD в программном и аппаратном обеспечении.
В настоящее время процессоры, использующие инструкции RISC в серверах среднего и высокого класса, в основном включают следующие категории: процессоры PowerPC, процессоры SPARC, процессоры PA-RISC, процессоры MIPS и процессоры Alpha.
(3)ИА-64
Было много споров о том, является ли EPIC (компьютеры с явными параллельными инструкциями) преемником систем RISC и CISC. Если рассматривать только систему EPIC, то переход процессоров Intel к системе RISC скорее похож на важный шаг. Теоретически процессор, разработанный системой EPIC, может обрабатывать прикладное программное обеспечение Windows намного лучше, чем прикладное программное обеспечение на базе Unix при той же конфигурации хоста.
Серверный процессор Intel, использующий технологию EPIC, — Itanium (кодовое название разработки: Merced). Это 64-битный процессор, первый в серии IA-64. Microsoft также разработала операционную систему под кодовым названием Win64 и поддерживает ее в программном обеспечении. После того, как Intel приняла этот набор, родилась архитектура IA-64, использующая набор инструкций EPIC. IA-64 — это огромное улучшение по сравнению с x86 во многих аспектах. Он преодолевает многие ограничения традиционной архитектуры IA32 и обеспечивает революционные улучшения в возможностях обработки данных, стабильности системы, безопасности, удобстве использования и значительной рациональности.
Самым большим недостатком микропроцессоров IA-64 является отсутствие совместимости с x86. Чтобы процессоры Intel IA-64 лучше работали с программным обеспечением двух поколений, они использовали процессоры IA-64 (Itanium, Itanium2...) и представили x86. Декодер -to-IA-64, который может преобразовывать инструкции x86 в инструкции IA-64. Этот декодер не является самым эффективным декодером и не лучшим способом запуска кода x86 (лучший способ — запускать код x86 непосредственно на процессоре x86), поэтому производительность Itanium и Itanium2 при запуске приложений x86 очень плохая. Это и стало фундаментальной причиной появления X86-64.
(4)X86-64 (AMD64/EM64T)
Разработанный AMD, он может одновременно обрабатывать 64-битные целочисленные операции и совместим с архитектурой X86-32. Он поддерживает 64-битную логическую адресацию и предоставляет возможность преобразования в 32-битную адресацию, однако инструкции по работе с данными по умолчанию используют 32-битную и 8-битную, а также предоставляют возможность преобразования в 64-битную и 16-битную; поддерживает регистры общего назначения, если это 32-битная операция, то необходимо расширить результат до полных 64 бит. Таким образом, существует разница между «прямым выполнением» и «выполнением преобразования» в инструкции. Поле инструкции имеет размер 8 или 32 бита, что позволяет избежать слишком длинного поля.
Создание x86-64 (также называемого AMD64) не беспочвенно. 32-битное адресное пространство процессоров x86 ограничено 4 ГБ памяти, а процессоры IA-64 несовместимы с x86. AMD полностью учитывает потребности клиентов и расширяет функции набора команд x86, чтобы этот набор инструкций мог одновременно поддерживать 64-битные режимы вычислений. Поэтому AMD называет их структуру x86-64. Технически, для выполнения 64-битных операций в архитектуре x86-64 компания AMD представила новый регистр общего назначения R8-R15 как расширение оригинальной функции «Используйте эти регистры». Исходные регистры, такие как EAX и EBX, также были расширены с 32 до 64 бит. В блок SSE добавлено восемь новых регистров для обеспечения поддержки SSE2. Увеличение количества регистров приведет к улучшению производительности. При этом для поддержки как 32-, так и 64-битных кодов и регистров архитектура x86-64 позволяет процессору работать в следующих двух режимах: Long Mode (длинный режим) и Legacy Mode (генетический режим). Длинный режим разделен на два подрежима: Режим (64-битный режим и режим совместимости). Этот стандарт был представлен в серверных процессорах AMD Opteron.
В этом году также была запущена технология EM64T, поддерживающая 64-разрядную систему. До официального названия EM64T она называлась IA32E. Это название 64-разрядной технологии расширения Intel, позволяющей различать набор команд X86. Intel EM64T поддерживает 64-битный подрежим, который аналогичен технологии AMD X86-64. Он использует 64-битную линейную адресацию плоскости, добавляет 8 новых регистров общего назначения (GPR) и добавляет 8 регистров для поддержки инструкций SSE. Как и в случае с AMD, 64-битная технология Intel будет совместима с IA32, а IA32E будет использоваться только при работе с 64-битной операционной системой. IA32E будет состоять из двух подрежимов: 64-битного и 32-битного, которые обратно совместимы с AMD64. Intel EM64T будет полностью совместим с технологией AMD X86-64. Теперь процессор Nocona добавил некоторые 64-битные технологии, а процессор Intel Pentium 4E также поддерживает 64-битную технологию.
Следует сказать, что обе архитектуры являются 64-битными микропроцессорами, совместимыми с набором инструкций x86, но между EM64T и AMD64 все же существуют некоторые различия. Бит NX в процессоре AMD64 не будет предусмотрен в процессорах Intel.
11. Суперконвейер и суперскаляр.
Прежде чем объяснять суперконвейер и суперскаляр, давайте сначала разберемся с конвейером. Этот конвейер впервые был использован Intel в чипе 486. Сборочная линия работает как сборочная линия в промышленном производстве. В ЦП конвейер обработки инструкций состоит из 5-6 схемных блоков с разными функциями, затем инструкция X86 делится на 5-6 шагов и затем выполняется этими схемными блоками соответственно, так что одна инструкция может быть выполнена за один раз. Тактовый цикл ЦП, тем самым увеличивая скорость вычислений ЦП. Каждый целочисленный конвейер классического Pentium разделен на четыре уровня конвейера, а именно: предварительная выборка инструкций, декодирование, выполнение и обратная запись результатов. Конвейер с плавающей запятой разделен на восемь уровней конвейера.
Суперскаляр использует встроенные несколько конвейеров для одновременного выполнения нескольких процессоров. Его суть заключается в обмене пространства на время. Суперконвейер заключается в выполнении одной или нескольких операций за один машинный цикл путем усовершенствования конвейера и увеличения основной частоты. Его суть заключается в обмене времени на пространство. Например, конвейер Pentium 4 состоит из 20 этапов. Чем длиннее шаги (стадии) конвейера, тем быстрее он может выполнить инструкцию, поэтому он может адаптироваться к процессорам с более высокими рабочими частотами. Однако слишком длинный конвейер также имеет определенные побочные эффекты. Весьма вероятно, что реальная скорость вычислений процессора с более высокой частотой будет ниже. Так обстоит дело с процессором Intel Pentium 4, хотя его основная частота может быть такой же высокой. 1,4G или более, но его вычислительная производительность намного уступает AMD Athlon 1,2G или даже Pentium III.
12. Форма упаковки
Упаковка ЦП — это защитная мера, в которой используются специальные материалы для упрочнения микросхемы ЦП или модуля ЦП во избежание повреждений. Как правило, ЦП необходимо упаковать, прежде чем его можно будет доставить пользователю. Способ упаковки ЦП зависит от формы установки ЦП и схемы интеграции устройств. С точки зрения широкой классификации ЦП, обычно устанавливаемые с использованием разъемов Socket, упаковываются с использованием PGA (сеточного массива), а все ЦП, установленные с использованием слотов Slot x, упаковываются. в упаковке SEC (Односторонняя распределительная коробка). Существуют также упаковочные технологии, такие как PLGA (Plastic Land Grid Array) и OLGA (Organic Land Grid Array). В связи с растущей жесткой рыночной конкуренцией текущее направление развития технологии упаковки ЦП в основном направлено на экономию средств.
7. Расширенный набор инструкций ЦП.
ЦП использует инструкции для расчета и управления системой. Каждый ЦП имеет ряд систем инструкций, соответствующих его аппаратным схемам. Надежность инструкций также является важным показателем ЦП. Набор инструкций — один из наиболее эффективных инструментов повышения эффективности микропроцессоров. В современной основной архитектуре набор инструкций можно разделить на две части: сложный набор команд и упрощенный набор команд. С точки зрения конкретных приложений, таких как Intel MMX (Multi Media Extended), SSE, SSE2 (потоковая передача с несколькими командами). data-Extensions 2), SEE3 и AMD 3DNow! — это расширенные наборы инструкций ЦП, которые соответственно расширяют возможности ЦП по обработке мультимедиа, графики и Интернета.
Мы обычно называем расширенный набор команд ЦП «набором инструкций ЦП». Набор инструкций SSE3 также является самым маленьким набором команд на данный момент. Раньше MMX содержал 57 команд, SSE — 50 команд, SSE2 — 144 команды, а SSE3 — 13 команд. В настоящее время SSE3 также является самым продвинутым набором инструкций. Процессоры Intel Prescott уже поддерживают набор инструкций SSE3. AMD добавит поддержку набора инструкций SSE3 в будущие двухъядерные процессоры Transmeta.
8. Ядро ЦП и рабочее напряжение ввода-вывода
Начиная с 586CPU, рабочее напряжение ЦП делится на два типа: напряжение ядра и напряжение ввода-вывода. Обычно напряжение ядра ЦП меньше или равно напряжению ввода-вывода. Величина напряжения ядра определяется в зависимости от производственного процесса ЦП. Как правило, чем меньше производственный процесс, тем ниже рабочее напряжение ввода-вывода обычно составляет 1,6–5 В; Низкое напряжение может решить проблемы чрезмерного энергопотребления и чрезмерного выделения тепла.
9. Процесс изготовления
Микрон производственного процесса относится к расстоянию между цепями внутри ИС. Тенденция в производственных процессах направлена на повышение плотности. Конструкция схем ИС с более высокой плотностью означает, что ИС одного и того же размера могут иметь схемы с более высокой плотностью и более сложными функциями. Сейчас основными являются 180нм, 130нм и 90нм. Недавно официальные лица заявили, что существует 65-нм производственный процесс.
10. Набор инструкций
(1)Набор инструкций CISC
Набор инструкций CISC, также известный как комплексный набор команд, английское название CISC (аббревиатура компьютера с комплексным набором инструкций). В микропроцессоре CISC каждая инструкция программы выполняется последовательно по порядку, и операции в каждой инструкции также выполняются последовательно по порядку. Преимущество последовательного выполнения заключается в простоте управления, однако коэффициент использования различных частей компьютера невысокий и скорость выполнения низкая. Фактически, это процессор серии x86 (то есть архитектура IA-32) производства Intel и совместимые с ним процессоры, такие как AMD и VIA. Даже новый X86-64 (также называемый AMD64) относится к категории CISC.
Чтобы понять, что такое набор команд, нам нужно начать с современного процессора с архитектурой X86. Набор инструкций X86 был специально разработан Intel для своего первого 16-разрядного процессора (i8086). Процессор первого в мире ПК — i8088 (упрощенная версия i8086), выпущенного IBM в 1981 году, также использовал инструкции X86. В компьютер Чип X87 был добавлен для улучшения возможностей обработки данных с плавающей запятой. С этого момента набор команд X86 и набор команд X87 будут вместе называться набором команд X86.
Несмотря на постоянное развитие технологии ЦП, Intel последовательно разработала новые модели i80386, i80486, вплоть до прошлых PII Xeon, PIII Xeon, Pentium 3 и, наконец, до сегодняшней серии Pentium 4, Xeon (за исключением Xeon Nocona), но для того, чтобы Чтобы гарантировать, что компьютер может продолжать запускать различные приложения, разработанные в прошлом, для защиты и наследования богатых программных ресурсов, все процессоры, производимые Intel, продолжают использовать набор команд X86, поэтому их процессоры по-прежнему относятся к серии X86. Поскольку все процессоры серии Intel X86 и совместимые с ними процессоры (например, AMD Athlon MP) используют набор инструкций X86, на сегодняшний день сформировалась огромная линейка процессоров серии X86 и совместимых процессоров. Процессор x86 в настоящее время в основном включает в себя серверные процессоры Intel и серверные процессоры AMD.
(2)Набор инструкций RISC
RISC — это аббревиатура от «Вычисления с сокращенным набором команд» на английском языке, что на китайском означает «сокращенный набор команд». Он был разработан на основе системы инструкций CISC. Кто-то протестировал машину CISC и показал, что частота использования различных инструкций сильно различается. Наиболее часто используемые инструкции — это относительно простые инструкции, на которые приходится лишь 20% инструкций. общее количество инструкций, но частота встречаемости в программе составляет 80%. Сложная система команд неизбежно приведет к увеличению сложности микропроцессора, что сделает разработку процессора длительной и дорогостоящей. А сложные инструкции требуют сложных операций, что неизбежно приведет к снижению скорости компьютера. По вышеуказанным причинам процессоры RISC появились в 1980-х годах. По сравнению с процессорами CISC, процессоры RISC не только упростили систему инструкций, но также приняли нечто, называемое «суперскалярной и суперконвейерной структурой», что значительно увеличило возможности параллельной обработки.
Набор инструкций RISC — это направление развития высокопроизводительных процессоров. Это противоположность традиционному CISC (сложному набору инструкций). Для сравнения, RISC имеет унифицированный формат инструкций, меньше типов и меньше методов адресации, чем сложные наборы команд. Конечно, скорость обработки значительно увеличивается. В настоящее время процессоры с этой системой инструкций обычно используются в серверах среднего и высокого класса, особенно на серверах высокого класса, которые используют процессоры с системой инструкций RISC. Система инструкций RISC больше подходит для UNIX, операционной системы высокопроизводительных серверов. Теперь Linux также является UNIX-подобной операционной системой. Процессоры типа RISC несовместимы с процессорами Intel и AMD в программном и аппаратном обеспечении.
В настоящее время процессоры, использующие инструкции RISC в серверах среднего и высокого класса, в основном включают следующие категории: процессоры PowerPC, процессоры SPARC, процессоры PA-RISC, процессоры MIPS и процессоры Alpha.
(3)ИА-64
Было много споров о том, является ли EPIC (компьютеры с явными параллельными инструкциями) преемником систем RISC и CISC. Если рассматривать только систему EPIC, то переход процессоров Intel к системе RISC скорее похож на важный шаг. Теоретически процессор, разработанный системой EPIC, может обрабатывать прикладное программное обеспечение Windows намного лучше, чем прикладное программное обеспечение на базе Unix при той же конфигурации хоста.
Серверный процессор Intel, использующий технологию EPIC, — Itanium (кодовое название разработки: Merced). Это 64-битный процессор, первый в серии IA-64. Microsoft также разработала операционную систему под кодовым названием Win64 и поддерживает ее в программном обеспечении. После того, как Intel приняла набор, и родилась архитектура IA-64 с использованием Epic Trading Set. IA-64-огромное улучшение по сравнению с X86 во многих аспектах. Он прорывается во многих ограничениях традиционной архитектуры IA32 и достигает прорывных улучшений в возможностях обработки данных, стабильности системы, безопасности, удобства использования и значительной рациональности.
Самый большой недостаток микропроцессоров IA-64-это отсутствие совместимости с X86. -О-64 декодер, который может перевести инструкции x86 в инструкции IA-64. Этот декодер не является наиболее эффективным декодером, и это не лучший способ запустить код x86 (лучший способ - запустить x86 -код непосредственно на процессоре x86), поэтому производительность итаний и итаний2 при запуске приложений x86 очень плохая. Это также стало фундаментальной причиной появления X86-64.
(4) x86-64 (AMD64 / EM64T)
Разработанный AMD, он может одновременно обрабатывать 64-битные целочисленные операции и совместим с архитектурой x86-32. Он поддерживает 64-битную логическую адресацию и предоставляет возможность преобразования в 32-разрядную адресацию; Поддерживает регистры общего назначения, если это 32-разрядная операция, необходимо расширить результат до полных 64 бит. Таким образом, существует разница между «прямым исполнением» и «выполнением преобразования» в инструкции.
Создание X86-64 (также называемое AMD64) не является необоснованным. AMD полностью рассматривает потребности клиентов и улучшает функции набора инструкций x86, так что этот набор инструкций может одновременно поддерживать 64-битные режимы вычислений. Технически, чтобы выполнить 64-битные операции в архитектуре X86-64, AMD представила новый реестр общего назначения R8-R15 в качестве расширения исходного использования этих регистров. Первоначальные регистры, такие как EAX и EBX, также были расширены с 32 бит до 64 бит. Восемь новых регистров были добавлены в устройство SSE, чтобы обеспечить поддержку SSE2. Увеличение количества регистров приведет к улучшению производительности. В то же время, чтобы поддержать как 32-, так и 64-битные коды, так и регистры, архитектура x86-64 позволяет процессору работать в следующих двух режимах: Long Mode (Long Mode) и режим Legacy (генетический режим). Длинный режим разделен на два подмода: режим (режим 64-битного режима и режим совместимости). Стандарт был введен в процессорах AMD Opteron Server.
В этом году была запущена технология EM64T, которая поддерживает 64-битную. EM64T Intel поддерживает 64-разрядную подразделение, которая аналогична технологии AMD X86-64. Подобно AMD, 64-битная технология Intel будет совместима с IA32 и IA32E. IA32E будет состоять из 2 подмодов: 64-битный подмод и 32-битный подмод, которые обратно совместимы с AMD64. Intel EM64T будет полностью совместим с технологией AMD X86-64. Теперь процессор Nocona добавил около 64-битной технологии, а процессор Intel Pentium 4E также поддерживает 64-битную технологию.
Следует сказать, что оба представляют собой 64-битную микропроцессорную архитектуру, совместимые с набором инструкций x86, но между EM64T и AMD64 все еще существуют различия.
11. SuperPipeline и SuperScalar
Прежде чем объяснить SuperPipeline и SuperScalar, давайте сначала поймем трубопровод. Трубопровод был впервые использован Intel в чипе 486. Сборка работает как сборочная линия в промышленном производстве. В процессоре трубопровод обработки инструкций состоит из 5-6 цепи с различными функциями, а затем инструкция x86 делится на 5-6 шагов, а затем выполняется этими цепи соответственно, чтобы одна инструкция была завершена в одной CPU Clock Cycle. Каждый целочисленный трубопровод классического Pentium делится на четыре уровня трубопровода, а именно инструкции, предварительно выбранные, декодирование, исполнение и написание результатов.
SuperScalar использует встроенные несколько трубопроводов для выполнения нескольких процессоров одновременно. Супер трубопровод состоит в том, чтобы завершить одну или несколько операций в одном машинном цикле путем усовершенствования трубопровода и увеличения основной частоты. Например, трубопровод Pentium 4 составляет до 20 этапов. Чем дольше представлены шаги (этапы) трубопровода, тем быстрее он может завершить инструкцию, поэтому он может адаптироваться к процессорам с более высокими рабочими частотами. Тем не менее, чрезмерно длинный трубопровод также приносит определенные побочные эффекты. Очень вероятно, что фактическая скорость вычисления процессора с более высокой частотой будет ниже. 1,4 г или более.
12. Форма упаковки
Упаковка ЦП - это защитная мера, которая использует конкретные материалы для затвердевания чипа ЦП или модуля ЦП, чтобы предотвратить повреждение. Метод упаковки ЦП зависит от формы установки ЦП и конструкции интеграции устройства. Использование SEC (односторонняя соединительная коробка) форма упаковки. Существуют также технологии упаковки, такие как PLGA (массив пластиковой земли) и OLGA (Marry Land Grid Array). Благодаря все более жесткой рыночной конкуренции, текущее направление развития технологии упаковки процессора в основном экономит.