Столь значительное увеличение сложности кристалла и повышение тактовой частоты было бы невозможно без перехода на 90-нм технологический процесс. Этот ответственный шаг компании Intel удалось сделать потому, что она применила технологию напряженного кремния и использовала новый изолятор затвора с лучшими показателями. Кроме того, она изменила топологию расположения функциональных блоков, чтобы улучшить равномерность тепловыделения и повысить тактовые частоты.
Улучшенная предварительная выборка данных была достигнута благодаря увеличению объема кэш-памяти первого и второго уровней. В отличие от хранилища инструкций L1, кэш данных L1 и интегрированный кэш L2 были увеличены в 2 раза — с 8 до 16 Кбайт и с 512 Кбайт до 1 Мбайт соответственно. Жаль только, что при этом возросла и латентность кэш-памяти. Такой побочный эффект наглядно демонстрирует, что наращивание встроенного кэша не есть прямой путь к повышению производительности, ведь с увеличением размера растет и время поиска в нем нужного фрагмента.
Инструкции SSE3 являются состоящим из 13 команд расширением ранее существовавшего набора SIMD-инструкций. Как только появится прикладное ПО, использующее их, то можно будет говорить о повышении производительности вследствие оптимизации программного кода.
Усовершенствования технологии Hyper-Threading выразились в возможности работы с потоками, использующими данные из встроенного кэша, и добавлении ряда инструкций, оптимизирующих ее.
Совершенствование операций сдвига shift/rotate позволило улучшить работу АЛУ процессора. Для этого добавлена поддержка инструкций обычного циклического сдвига, в результате чего арифметические операции с целыми числами выполняются быстрее.
Улучшенное предсказание ветвлений. Теперь, когда в буфере переходов не происходит накопления статистики о выполненных ветвлениях, Prescott выбирает направление переходов после анализа расстояния до условия. Иными словами, Prescott отличает цикл от ветвления, что улучшает показатель предсказанных переходов.
Дополнительные WC-буферы (служебные буферы вычислений, называемые Write Combining и находящиеся в самом ядре) должны привести к росту производительности и выполнению большего числа инструкций за единицу времени.