|
За более чем 5 лет было выпущено множество ядер и моделей Pentium 4,
основанных на них. Причем с выходом новой модели к названию процессора
добавлялись либо новая буква, либо еще какие-нибудь цифры, а иногда и то, и
другое; всё это существенно запутывает идентификацию конкретной модели.
Процессор Pentium 4 построен на совершенной новой архитектуре — NetBurst.
Ниже приведены некоторые отличительные особенности оригинальной архитектуры
NetBurst (некоторые из них в последующем были изменены).
- Конвейер. Длина
конвейера была увеличена до 20 шагов, то есть для завершения одной команды
процессору требовалось 20 циклов. Данный шаг позволял значительно легче
наращивать тактовую частоту, кроме того, в перспективе это позволяло
значительно повысить быстродействие, но производительность в расчете на 1 МГц
была меньше, чем у предыдущих процессоров. Отчасти этим объясняется низкая
производительность Pentium 4, работающего на низких частотах. Так же в
результате такого нововведения увеличилось и время ожидания.
- Модуль предсказания переходов (ветвлений). Чтобы компенсировать недостатки
применения длинного конвейера инженеры Intel улучшили схему предсказания
ветвлений, в результате правильность перехода предсказывалась с вероятностью
до 95 %.
- Системная шина. В Pentium 4 используется совершенно новая 128-битная системная
шина с двумя 64-битными линиями. Частота новой шины(FSB) составляет 100 МГц (у
последних, тогда, моделей Pentium III она составляла 133 МГц), однако за счет
передачи за 1 такт одновременно 4 пакетов (QPB —
Quad Pumped Bus), эффективная частота шины составляла 400 МГц, а пропускная
способность шины составляла 3200 Мб/с.
- Арифметико-логическое устройство (АЛУ или ALU). В АЛУ
обрабатываются целочисленные команды. В новом процессоре АЛУ работает на
удвоенной частоте ядра (у Pentium 4 1,5ГГц АЛУ работает на частоте 3 ГГц за
счет использования обоих фронтов сигнала). Таким образом, некоторые инструкции
выполняются за половину такта. В Pentium 4 используются два АЛУ.
- Кэш-память
первого уровня (L1). Как и прежде кэш L1 разделен на две части: для команд и
для данных. В кэше теперь хранятся декодированные команды и располагаются в
порядке их выполнения (технология Trace
Cache), что увеличивает производительность.
- Математический Сопроцессор (FPU). Математический
сопроцессор содержит два модуля для операций с плавающей запятой. Но реальную
вычислительную работу выполняет лишь один модуль — это операции сложения
(FADD) и умножения (FMUL), второй модуль выполняет операции обмена между регистрами и
памятью (FSTORE). Для процессора Pentium 4 1,4 ГГц сопроцессор обеспечивает
производительность в 1,4 GFLOPS. К примеру, в процессорах
Athlon
используется сопроцессор, состоящий из трех модулей (один для операций типа
FSTORE, два других для операций типа FADD и FMUL) и обеспечивающий
производительность в 2 GFLOPS (для процессора Athlon 1 ГГц).
- SIMD-расширения. В процессор
Pentium 4 был добавлен новый набор SIMD-расширений (SSE2), который добавил 144 новые
инструкции (68 целочисленных инструкций и 76 инструкций для вычислений с
плавающей запятой).
В целом, архитектура была нацелена для работы на высоких частотах, где в
полную силу смог бы заработать длинный конвейер.
|