簡要介紹
英特爾酷睿微體系結構是基於新型英特爾架構的台式機、筆記本電腦和主流伺服器多核處理器的基礎。英特爾酷睿微體系架構擁有一流的性能和多種創新特性,且針對多核進行了特別最佳化,樹立了高能效表現的新標準。 工作效率顯著增強,憑藉卓越的性能和能效,英特爾酷睿微體系架構為許多新的解決方案和外形設計奠定了良好的基礎。 家用電腦將具備強大的性能、超低的噪音、時尚的外形和高能效表現,以及更完善的用戶易用型娛樂系統。 對於 IT 人員,它可以減少設備的占地面積、降低伺服器數據中心的功率和散熱負擔、提高客戶機和伺服器平台的回響能力、工作效率和能效。 對於筆記本電腦用戶,英特爾酷睿微體系架構擁有更強大的計算性能、更持久的電池使用時間和更加小巧的外形,以及強大的移動計算體驗。[3] 英特爾酷睿微體系結構,是一款領先節能的新型微架構,設計的出發點是提供卓然出眾的性能和能效,提高每瓦特性能,也就是所謂的能效比。英特爾酷睿微體系結構面向伺服器、台式機和筆記本電腦等多種處理器進行了多核最佳化,其創新特性可帶來更出色的性能、更強大的多任務處理性能和更高的能效水平,各種平台均可從中獲得巨大優勢:伺服器可以更快速,更低的功耗為企業節省大筆開支,創新技術保證安全穩定的運行。台式機可以在占用更小空間的同時,為家庭用戶帶來更多全新的娛樂體驗,為企業員工帶來更高的工作效率。筆記本電腦用戶可以獲得更高的移動性能和更耐久的電池使用時間。英特爾酷睿微架構擁有4組解碼器,相比上代Pentium Pro (P6) / Pentium II / Pentium III / Pentium M架構擁有3組可多處理一組指令,簡單講,每個核心將變得更加“寬闊”,這樣每個核心就可以同時處理更多的指令。英特爾酷睿微體系結構在提升每個時鐘周期的指令數方面做了很多努力,例如新加入宏融合(Macro-Fusion)技術,它可以讓處理器在解碼的同時,將同類的指令融合為單一的指令,這樣可以減少處理的指令總數,讓處理器在更短的時間內處理更多的指令。為此英特爾酷睿微體系結構也改良了ALU(算術邏輯單元)以支持宏融合技術。[5] 英特爾寬區動態執行動態執行包含多項技術(數據流分析、預測執行、亂序執行與超標量),這些技術最先出現在英特爾奔騰Pro處理器、英特爾奔騰II處理器和英特爾奔騰III處理器的P6微架構中。在英特爾NetBurst微體系結構中,英特爾推出了高級動態執行引擎 —一個非常深、用以保持處理器執行單元不斷執行指令的亂序預測執行引擎。該微體系結構還採用了增強的分支預測算法來減少分支出錯的次數。 現在對於英特爾酷睿微體系結構,英特爾通過英特爾寬區動態執行大幅增強了這一能力。它可以讓每個時鐘周期執行更多的指令,以縮短執行時間並改進能效。每個執行核心將變得更加寬闊,這樣它們就可以同時獲取、分配、執行和返回達4條完整的指令。(英特爾的移動和英特爾NetBurst微體系結構每次可處理3條指令)。進一步提高效率的特性包括可以進一步提高執行靈活性的更精確的分支預測、更深的指令緩衝區,以及可以縮短執行時間的其它特性。 其中一項可以縮短執行時間的特性就是微融合。在前幾代處理器中,每條進入的指令均會被單獨地解碼和執行。微融合可以在解碼期間將常用的指令對(如條件分支(conditional jump)後的比較)融合為單個內部指令(微操作)。這樣2條程式指令就可以作為1個微操作執行,以減少處理器必須執行的整體工作量。這增加了給定時間內可以運行的全部指令數量,或者減少了運行一定指令數量的時間。通過在更短的時間內完成更多的任務,微融合提高了整體性能和能效。 英特爾酷睿微體系結構還包含增強的運算邏輯單元(ALU),以進一步支持微融合。 它能夠在單個周期內執行組合的指令對,從而使性能得到提升。 英特爾酷睿微體系結構還改進了微操作融合 — 這是一種最先套用於英特爾奔騰M處理器的高能效技術。在現代主流處理器中,×86程式指令(微操作)在送往處理器管道接受處理之前,會被細分為多個組成部分,即微操作。微操作融合將“融合”源自相同宏操作中的微操作,以減少需要執行的微運算元量。微運算元量的減少可使時序安排工作更加高效,從而實現更低的功率和更高的性能。研究顯示,微操做融合可使亂序邏輯處理的微運算元量減少10%以上。在英特爾酷睿微體系結構中,可以內部融合至處理器的微運算元量將進一步增多。發展歷史
2006 年,英特爾首次在採用 65納米矽製程技術的英特爾酷睿2 微體系結構處理器中引入了英特爾酷睿微體系結構。作為第一代多核最佳化型微體系結構,它擴展了英特爾奔騰M處理器的移動式微體系結構中首次提出的能效理念,並利用諸多全新的領先微體系結構創新特性對其進行了增強,由此實現了業界領先的性能、更高的能效表現和更快的多任務處理回響能力。 2007 年下半年,英特爾開始投產代號為“Penryn”的下一代英特爾酷睿2 處理器家族產品。Penryn 處理器家族基於英特爾業界領先的 45納米高K 金屬柵極矽製程技術和最新的英特爾酷睿微體系結構增強特性構建而成。英特爾酷睿微體系結構在英特爾早前大獲成功的革命性微體系結構(當前英特爾至強處理器家族和英特爾酷睿2 處理器家族所用)基礎之上,又進行了重大改進,這標誌著英特爾在每年推出一種新製程技術及增強型微體系結構或全新微體系結構的道路上又邁出了重大一步。 45納米Penryn家族中的雙核處理器擁有 4 億多個電晶體,四核處理器擁有8億多個電晶體。藉助全新微體系結構特性,該處理器家族產品還可在頻率不變的情況下實現更高的性能,同時增大50%的二級高速快取,以及擴展的電源管理能力可讓能效表現再上新台階。Penryn 家族還採用了近50條全新的英特爾SSE4 指令,可進一步加快媒體套用和高性能計算套用的運行速度。Penryn 家族包括全新雙核台式機處理器、四核台式機處理器、四核伺服器處理器和雙核移動式處理器。創新要點
台式機可以在占用更小空間的同時,為家庭用戶帶來更多全新的娛樂體驗,為企業員工帶來更高的工作效率。筆記本電腦用戶可以獲得更高的移動性能和更耐久的電池使用時間。以下英特爾酷睿微體系結構的幾大創新點:英特爾寬位動態執行
英特爾寬位動態執行(Intel Wide Dynamic Execution) 衡量一款處理器的性能水平,已經不能再單純的以頻率的高低考量,而是更強調“每瓦特性能”,也就是所謂的能效比。“性能=頻率×每個時鐘周期的指令數”是英特爾提出的對性能的創新理解,英特爾寬位動態執行通過提升每個時鐘周期完成的指令數,從而顯著改進執行能力。 英特爾酷睿微架構擁有4組解碼器,相比上代Pentium Pro (P6)/Pentium II / Pentium III / Pentium M架構擁有3組可多處理一組指令,簡單講,每個核心會變得更加“寬闊”,這樣每個核心就可以同時處理更多的指令。英特爾酷睿微體系結構在提升每個時鐘周期的指令數方面做了很多努力,例如新加入宏融合(Macro-Fusion)技術,它可以讓處理器在解碼的同時,將同類的指令融合為單一的指令,這樣可以減少處理的指令總數,讓處理器在更短的時間內處理更多的指令。為此英特爾酷睿微體系結構也改良了ALU(算術邏輯單元)以支持宏融合技術。 Core擁有3個64-bit整數執行單元(Integer Execution Units),每個單元可以獨立處理一條64-bit整數數據,這樣Core就有了一套64-bit的CIU複雜整數單元(Complex Integer Unit),這和P6構架相同。然後Core另外有2個SIU簡單整數處理單元(Simple Integer Units)來快速運算較簡單的任務,其中一個SIU和分支執行單元BEU來共同完成部分的宏指令融合micro-ops fusion。對於INTEL的X86 CPU來說,這是首次可以在一周期內完成一階64-bit的整數運算,這使Core已經走到了IBM PowerPC 970的前面-PowerPC 970需要有2個周期的延遲。另外,因為3個IEU整數執行核心使用了各自獨立的PORT數據出口,所以整個Core處理器可以在一周期內同時執行3組64-bit的整數運算。 有著如此強大的整數處理單元,Core在性能上會比已有Pentium 4快的多,它在移動平台、伺服器、3D圖形上4倍於Pentium 4的性能表現會使全世界對INTEL CPU眼目一新。Core構架擁有2個浮點執行單元(Floating-Point Execution Units)同時處理向量和標量的浮點數據,位於PORT 1的FPEU-1浮點執行單元負責加減等簡單的處理,而PORT 2的FPEU-2浮點執行單元則負責乘除等運算,這樣在Core中就把FADD/VFADD和FMUL/VFMUL劃分為兩組,使其具備了在一周期中完成兩條浮點指令的能力。