본문 바로가기
팁 & 테크

인텔 프로세서의 발자취 : 3부 (Netburst)

by 테리™ 2009. 1. 1.
반응형

인텔의 P6 아키텍처 기반 프로세서들은 성공적인 제품들이었다. 6세대 x86 아키텍처에서 인텔은 많은 변화를 만들어 냈다. L2 캐시를 프로세서 안에 내장하고, 제조 공정에서도 극적인 발전을 이루어 냈으며 기념비적인 1GHz 클럭의 벽 또한 넘었다.

인텔이 x86의 일곱 번째 주자로 준비한 것은 지금도 회자되는 '넷버스트(Netburst)' 아키텍처였다. 지난 2000년 11월에 시장에 데뷔한 '펜티엄 4 프로세서'가 처음으로 이 아키텍처를 사용했다.

넷버스트 아키텍처는 기존의 P6와는 완전히 다른 구조를 가지고 있었으며, 7세대 프로세서의 명칭을 달 수도 있었으나 프로세서의 클래스는 여전히 6세대에 머물렀다. 그 이유는 7세대 클래스명을 IA64 기반의 아이테니엄(Itanium) 프로세가 가져갔기 때문이다.

성능을 위한 새로운 발상들


▲ '넷버스트 아키텍처'는 네 단계를 거치며 진화했다.

P6 아키텍처의 특징은 고효율성이다. 다수의 비교적 짧은 파이프라인을 사용하여 단위 클럭당 높은 IPC를 얻을 수 있는 것이 P6 아키텍처의 특징이었다. 또한 비순차적 실행 방식 덕분에 어떤 상황에서도 비교적 고른 성능을 보여준다는 것 또한 장점이었다.

하지만, P6 아키텍처는 병렬 파이프라인의 구조상 클럭을 끌어올리기가 쉽지 않았다. 효율은 높았지만, 절대적 성능을 끌어올리는 데는 한계가 있었던 것이다. 절대적 성능을 끌어올리기 위해 인텔은 발상을 전환했고, 그 결과가 넷버스트 아키텍처로 나타났다.

넷버스트 아키텍처의 가장 큰 특징은 높은 클럭이다. 이를 가능하게 한 것은 대폭 증가한 파이프라인 깊이다. 슈퍼스칼라 구조를 사용할 경우, 최적화된 환경에서 파이프라인 깊이가 증가하면 클럭을 높이기가 비교적 수월해진다. 높은 클럭을 통해 성능을 높이는 구조다.

프로세서가 하나의 명령어를 처리하기 위해서는 네 가지 단계가 필요하다. 읽기(Fetch), 해석(Decode), 실행(Excute), 기록(Write Back)이 그것이다. 이 과정을 진행할 때 하나의 클럭이 소비된다. 파이프라인을 사용한 슈퍼스칼라 방식은 여러 개의 파이프라인과, 각 단계별로 명령어를 미리 대기시켜 지연시간을 줄이고 연속적인 처리로 성능을 높이는 방법이다.

파이프라인이 세분화되면, 일반적으로 명령어 처리에 필요한 네 가지 단계를 더욱 세분화하게 된다. 명령어 처리에 걸리는 시간 또한 그만큼 줄어들게 되고, 한 명령어를 처리하기 위해 클럭 수는 더 필요하지만, 클럭 스피드를 더 끌어올릴 수 있게 된다. 파이프라인에는 각 단계별로 서로 다른 명령어가 들어갈 수 있다. 클럭당 효율은 낮지만 시간당 처리량은 늘어나는 구조다.

P6 아키텍처를 사용한 펜티엄 3는 10단계의 파이프라인을 가지고 있다. 하지만 처음 발표된 펜티엄 4, 코드명 윌라멧(Willamette)은 20단계 파이프라인을 가지고 있다. 파이프라인이 두 배가 더 길어진 만큼, 코어 구조상의 한계 클럭은 대폭 상승했다. 초기 모델이 1.4GHz부터 시작했으며, 이는 예전 펜티엄 3의 한계 클럭에 가까운 수준이다.

이후에 노스우드(Northwood)와 프레스캇(Prescott)을 거치면서 클럭 면에서는 당분간 깨지기 힘들 정도의 기록을 세워놓기도 했다. 프레스캇 코어의 펜티엄 4는 최대 3.8GHz까지 시판되었으며, 이는 아직까지도 리테일 시장에서 다른 업체에서 보여주지 못한 고클럭이다. 반면 엔터프라이즈 시장에서는 IBM 파워 프로세서 계열이 최고클럭 기록 갱신을 이어가고 있다.

넷버스트 아키텍처는 깊은 파이프라인 덕분에 클럭은 높아졌지만 클럭당 효율 면에서는 기존의 P6에 비해 떨어진다. 이를 해결하기 위해 도입한 기술이 'Rapid Execution Engine' 이다. 프로세서의 연산 유닛을 코어 클럭의 두 배로 동작시키는 이 기술은 낮은 효율을 높은 연산 유닛의 클럭으로 보완해 준다. 또한 분기 예측 유닛과, 명령어 최적화를 위한 새로 디자인된 L1 캐시를 사용했다.

한편, 넷버스트 아키텍처에서는 FSB 또한 대폭 높아졌다. 기존의 P6 기반에서 성능의 발목을 잡던 병목 현상을 해결하기 위해 넷버스트 아키텍처에서는 FSB에 쿼드 펌핑을 사용해 시스템 대역폭을 대폭 높여 병목 현상을 다소 해결했다.

넷버스트 아키텍처의 한계


▲ 지나친 발열은 '쿨러'만으로는 잡을 수 없다.

넷버스트 아키텍처의 깊은 파이프라인은 단점으로도 작용했다. 인텔은 깊은 파이프라인의 효율을 높이기 위해 새롭게 디자인된 L1 캐시를 적용했으며, 이를 사용해 최대한 파이프라인의 효율을 높이고자 했다.

하지만 문제는 분기 예측 유닛의 확률이었으며, 분기 예측이 빗나갈 경우 최악의 경우에는 파이프라인 전체를 비워야 하는 문제가 생긴다. 실제로 이런 문제는 상당히 빈번하게 일어났고, 실 성능을 상당히 떨어뜨렸다. 연속적인 데이터가 들어와 분기 예측이 수월한 프로그램에서는 높은 성능을 보여주었지만, 그렇지 못한 프로그램에서는 크게 효율이 떨어지는 모습을 보여주었다.

높은 클럭 또한 넷버스트 아키텍처의 발목을 잡았는데, 높은 클럭으로 인한 심한 전력 소모와 발열, 그리고 이로 인한 클럭 상승의 한계가 복합적으로 발목을 잡는 상황이 벌어졌다. 순식간에 장점이 단점으로 둔갑한 셈이다.

P6 기반의 펜티엄 3가 1GHz 수준에서 30W 정도의 TDP를 가진 반면에, 펜티엄 4는 1.4GHz 수준에서 60W를 훌쩍 넘기는 전력 소모를 보여 주었으며, 이후 프레스캇에 이르러서는 100W를 넘기는 모습까지 보여 주었다. 또한 초기 프레스캇 모델 중 일부는 번들로 제공된 쿨러로 제대로 프로세서 발열에 제대로 대응하지 못하는 모습을 보여주기도 했다.

인텔은 넷버스트를 처음 소개하면서, 프로세서의 속도가 10GHz에 이르게 될 것이라고 예상했다고 한다. 하지만 실제 인텔이 넷버스트 아키텍처를 통해 달성한 클럭 속도는 3.8GHz 정도였는데, 이는 넷버스트 아키텍처의 한계도 있었지만 더 큰 문제는 극복하지 못할 물리적 한계를 너무 얕봤다는 것이다.

고클럭으로 동작하는 프로세서에서 일반적으로 문제가 되는 곳은 반도체 게이트인데, 클럭이 높아질수록 게이트의 유전 성질은 나빠지고, 누설되는 전류량은 증가하게 된다. 누설된 전류는 발열의 형태로 나타나게 되고, 온도가 높아지면 게이트의 유전 성질은 더욱 악화되어 누설 전류는 더 늘어나는 악순환이 이어진다.

이런 게이트의 유전 성질 문제는 공정이 미세화되고 물리적인 크기가 작아질수록 더욱 문제가 심각해졌다. 결국 인텔은 45nm 공정에 와서, 반도체에 있어 금기라고까지 여겨졌던 High-k 유전체를 사용하여 이 문제를 근본적으로 해결하게 되었다. 차세대 공정이 논의되는 요즘에도 공정 고도화에 따른 소재 문제는 여전히 인텔에게 골치꺼리다.

데스크톱용 펜티엄 4 - 윌라멧부터 시더밀까지

넷버스트 아키텍처의 첫 작품은 2000년 11월 발표된 펜티엄 4, 코드명 윌라멧(Willamette)이다. 이 프로세서는 0.18 미크론 공정을 사용했으며, 256KB의 L2 캐시를 가지고 있었다. 윌라멧에서 처음 등장한 SSE2는 144개의 단축 명령어로 이루어져 있으며, 이를 사용할 경우 큰 성능 향상을 얻을 수 있었다. 하지만 일반적으로는 낮은 효율과 비교적 낮은 클럭으로 인해 펜티엄 3 보다 크게 나은 건 아니었다.

처음에는 소켓 423용으로 등장했으며, 표준 구성은 i850과 RDRAM 구성이었다. 그런데 RDRAM의 가격이 시장에서 크게 문제가 되었다. 높은 가격때문에 보통은 845 시리즈와 SDR 혹은 DDR SDRAM과 조합되었는데, 이 경우엔 메모리 대역폭이 프로세서가 필요로 하는 대역폭에 턱없이 모자라서 제 성능이 나오지 않았다. 또 후기 버전에서는 소켓 478로 이동하면서 혼선을 불러왔다.

크게 늘어난 전력소모와 발열은 시스템에도 변화를 가져왔다. 파워 서플라이에서 프로세서 전용 12V 출력을 요구한 것과, 쿨러를 위해 만들어진 4핀 홀 규격이 바로 이 때 벌어진 일이다. 특히 4핀 규격은 처음에는 케이스 규격에까지 고정 홀을 요구했으나, 이후 메인보드에서만 고정하는 것으로 바뀌어 갔다. 그동안의 전통적인 케이스 구조설계가 프로세서로 인해 본의가 아닐 변화를 맞이했다.


▲ 노스우드에서 처음 사용된 'Hyper-Threading 기술'

넷버스트의 힘을 제대로 보여준 것은 노스우드(Northwood) 코어에 이르러서이다. 안정화된 0.13 미크론 공정으로 등장했으며, 일부 명령어의 최적화와 분기예측 유닛의 개선, L2 캐시의 증가로 효율의 증가를 얻어낼 수 있었다. 클럭 또한 크게 높여서, 높은 클럭을 전제로 만들어진 넷버스트 아키텍처의 힘을 잘 보여주었다.

노스우드 코어에서 인상적인 프로세서라면 노스우드 C 시리즈를 꼽을 수 있다. C 시리즈에서는 넷버스트의 깊은 파이프라인이 가지는 비효율성을 이용해 두 개의 스레드를 비어 있는 파이프라인에 순차적으로 집어넣을 수 있게 한 하이퍼스레딩(Hyper-Threading) 기술이 등장했다. 요즘 멀티코어가 주는 멀티 쓰레드를 논리적으로 구현한 셈이다.

하나의 물리적 프로세서가 논리적으로 두 개의 프로세서처럼 동작하며, 멀티스레드 구조의 프로그램에서는 다소의 성능 향상을 얻을 수 있었지만 당시의 프로그램 환경에서는 큰 이득을 얻기 힘들었다. 이를 제대로 쓰기 위해서는 멀티 쓰레드를 지원하는 소프트웨어가 나와야 했는데, 이 부분에 대한 업계 전체의 본격적인 지원은 한참 후인 코어 프로세서 시리즈에서나 이루어졌다.


▲ 넷버스트 아키텍처는 프레스캇 코어에서 크게 변경되었다.

넷버스트 아키텍처는 프레스캇(Prescott) 코어에서 또 한번의 큰 변화를 맞았다. 90nm 공정을 사용하여 제대로 된 나노 공정 시대를 열었으며, 더 커진 L2 캐시와 SSE3를 통해 기존의 프로세서와 차별화를 시도했다. 또한 프로그램에서 버퍼 오버플로우를 통한 시스템 장악을 막아주는 기능인 XD bit같은 기능들이 추가되었으며, 'LGA775' 소켓이 본격적으로 보급되기 시작했다.

프레스캇 코어에서 가장 눈에 띄는 것은 파이프라인 구조의 변경이다. 기존의 20단계 파이프라인을 31단계까지 더 늘렸다. 노스우드 코어가 3.2GHz 수준에서 클럭의 한계에 다다르자, 인텔은 그 한계를 넘기 위한 방법으로 파이프라인을 늘리는 방법을 택한 것이다.

하지만 이 방법은 그다지 성공적이지 못했다. 클럭은 예상보다 크게 올라가지 않았는데, 이는 위에서 언급했다시피 프로세서의 논리 구조적 문제라기보다는 오히려 물리적인 한계가 발목을 잡았기 때문이다. 지금도 회자되는 '발열' 전설의 주역이 바로 프레스캇이다.

기술적인 부분에서 프레스캇 코어에는 EM64T가 추가되었다. x86 명령어의 구조를 유지하면서 64비트 확장 형태로 만들어진 EM64T는 x86과 호환성을 유지하면서 64비트 구조의 프로그램을 사용할 수 있도록 했다. 32비트 구조에서의 4GB 메모리 제약을 벗어날 수 있는 가장 현실적인 방법이었지만, 막상 데스크톱 시스템에서는 메인보드에 있는 메모리 컨트롤러의 한계로 인해 실용적이지는 못했다.

프레스캇 코어는 일단 클럭을 끌어올리는 데는 성공했다. 노스우드에서 벽처럼 느껴지던 3.2GHz를 넘어 3.8GHz까지 제품을 출시했다. 하지만 심각한 전력소모와 발열이 문제되었는데, 문제는 누설 전류가 너무 많다는 것이었다. 이는 논리 회로의 개선으로는 완전히 해결할 수 없는 물리적인 한계에 가까운 문제였고, 클럭은 예상보다 많이 올라가지 않았다.

넷버스트 아키텍처의 마지막 세대는 코드명 시더밀(Ceder mill)이다. 65nm 공정으로 만들어졌고, 전체적인 사양은 변하지 않았지만 내부적으로 구조가 최적화되어 개선된 전력소모와 발열을 보여주었다. 또한 프레스캇 일부 모델에서 지원되던 EIST가 지원되었는데, 최소 배수와 최대 배수의 차이가 크지 않아 효과는 거의 없었다.

한편, 프레스캇 코어가 등장하면서 인텔은 제품 라인업을 새로 정리하게 된다. LGA775 기반의 제품부터 인텔은 프로세서 제품명에 클럭을 사용하지 않고, 모델 넘버를 사용했다. 이는 프로세서의 사양을 일정 규칙에 맞춘 숫자로 표현해 알아보기 쉽게 하기 위함이었다.

넷버스트 아키텍처 기반에서는 300, 500, 600번대를 사용했는데, 300번대는 셀러론 시리즈가 사용했으며, 500번대는 L2 캐시 1MB의 프레스캇이 사용했고, 600번대는 L2 캐시 2MB의 프레스캇과 시더밀이 사용했다.


▲ 인텔 플래그쉽 프로세서의 자존심, '익스트림 에디션'

제품군이 세분화되면서 데스크톱 라인업에서도 새로운 라인업이 등장했는데, 데스크톱 모델에서의 플래그쉽급 라인업인 익스트림 에디션(Extreme Edition) 시리즈가 그것이다. 이 시리즈의 특징은 당대의 코어에서 구현 가능한 최고 클럭, 최고 성능의 제품이라는 것과, 일반 제품에 존재하는 배수 제한이 없다는 것이다. 하지만 가격 또한 익스트림 급이라 주위에서 보기는 쉽지 않다.

처음 등장한 익스트림 에디션은 코드명 갤러틴(Gallatin)인데, 이 프로세서는 제온 프로세서에서 멀티프로세서 지원 기능을 제외한 상태로 내놓은 것이다. 데스크톱 라인업에서는 유일하게 L3 캐시까지 가지고 있었던 제품이다. 프레스캇 코어를 사용한 익스트림 에디션에서는 2MB의 L2 캐시를 가지고 있었으며, 코어 클럭은 3.73GHz, FSB는 1066MHz를 사용했다. 칩셋은 초기에 925XE 칩셋만 대응되었다.

셀러론 라인업 또한 넷버스트 아키텍처에서의 변화를 그대로 따라간다. 주력 코어에서 L2 캐시와 FSB를 제한하는 방법으로 계속 제품이 출시되었다. 윌라멧 기반의 셀러론은 처음 등장했을 때 845 칩셋과 SDRAM 조합으로 주로 사용했는데, 메모리 대역폭 문제로 제 성능을 내지 못해 상당히 평가가 좋지 못했다.

셀러론 또한 프레스캇 이후 변화를 겪는데, 프레스캇 이후의 셀러론은 '셀러론 D'로 불린다. 프레스캇의 L2 캐시가 늘어난 만큼, 셀러론 D의 L2 캐시도 256KB로 늘어났고, FSB도 533MHz로 올라가면서 성능이 개선되었다. 이후 시더밀 기반의 셀러론 D에서는 L2 캐시가 512KB까지 늘어났으며, 펜티엄 4 시리즈에서 지원하던 대부분의 기능을 모두 지원했다.

듀얼 코어의 시대, '펜티엄 D 프로세서'

시대의 대세가 멀티프로세서로 흘러가고, 경쟁사가 ‘듀얼 코어’ 프로세서를 먼저 출시하자, 인텔이 뒤이어 듀얼 코어 프로세서를 내놓았다. 지금까지 제온 계열에서나 가능하던 물리적인 듀얼 스레드 구성을 저렴한 단일 프로세서 기반에서 구현할 수 있게 해 준 듀얼 코어 프로세서는 이후 업계의 대세로 자리잡았고, 싱글 코어 프로세서는 빠른 속도로 듀얼 코어 이상의 프로세서로 대체되었다.

인텔이 처음 준비한 듀얼 코어 프로세서는 코드명 스미스필드(Smithfield)인 펜티엄 D 800 시리즈이다. 프레스캇 코어 두 개를 한 칩 위에 올린 형태의 이 프로세서는, 일단 칩의 형태로 보면 하나의 칩이지만, 코어 자체는 물리적으로 분리된 형태인 아주 애매한 형태를 취했다. 별도의 코어는 모두 FSB를 통해 연결되었으며, 멀티프로세서 시스템과 같은 형태로 동작했다.

이 프로세서는 처음 등장할 때 상당한 파장을 불러 일으켰다. 일단 싱글 코어에서 말이 많았던 프레스캇 코어 두 개를 그대로 올렸기 때문에 발열과 전력 소모 면에서는 당대 최고였다. 코드명 ‘대장간’에 어울릴 만큼 높은 발열과 전력 소모는 고성능의 파워 서플라이와 쿨링 솔루션을 요구했고, 이는 전체적인 시스템 비용의 상승을 가져왔다.

또한 메인보드 문제가 있었다. 기존 915/925 칩셋에서 이 프로세서가 제대로 동작하지 않았다. 865/875에서는 이런 문제가 발생하지 않았는데, 그 이유는 메인보드 칩셋 정책에서 찾을 수 있다. 인텔의 메인보드 정책에서 제온 계열 지원 칩셋과 펜티엄 계열 지원 칩셋의 라인업은 엄연히 분리되어 있다. 그런데 가격문제로 일부 업체에서 변종모델을 출시했다. 이를 막기 위해 인텔은 915/925에서 멀티프로세서 지원을 완전히 막아버리게 되었다.

하지만 막상 펜티엄 D는 내부적으로는 듀얼 프로세서 형태이고, 멀티프로세서 지원이 막힌 915/925에서는 당연히 제대로 작동할 리가 없었다. 그래서 945 시리즈부터는 이를 지원하기 위해 다시 멀티프로세서 지원이 들어가게 되었고, 펜티엄 D를 제대로 지원할 수 있게 되었다. 펜티엄 D 800 시리즈의 익스트림 에디션에서는 펜티엄 D와의 차별을 위해 HT를 사용했다. 펜티엄 D가 물리적인 듀얼 코어로 HT 기능을 제외한 데 반해, 익스트림 에디션에는 각 코어별로 HT를 포함하여 최대 4스레드의 처리가 가능했다.


▲ 프레슬러는 멀티칩 패키징을 사용해 듀얼 코어를 구현했다.

싱글 코어 프로세서의 코어가 65nm 기반의 시더밀로 이동함에 따라 듀얼 코어 프로세서 라인업도 65nm 기반으로 이동했다. 65nm 기반 펜티엄 D는 코드명 '프레슬러(Presler)'로 불리었다. 외형적으로는 800 시리즈에 비해 L2 캐시가 두 배 늘어났을 뿐이지만, 내부적으로는 상당히 다른 면모를 보여주었다.

프레슬러는 스미스필드와 달리 완전히 멀티칩 패키징을 사용했다. 프로세서에 물리적인 두 개의 코어를 확인할 수 있는데, 이 방법은 이후 인텔이 쿼드 코어 프로세서를 내놓을 때도 똑같이 사용하게 된다.

멀티칩 패키징을 사용한 가장 큰 원인으로는 싱글 코어와 듀얼 코어를 따로 만드는 데 드는 비용의 문제가 있었다. 스미스필드는 일단 하나의 칩에 두 개의 코어를 올리는 형태라 기본적으로 프레스캇과 다른 라인을 사용하여 제조되어야 했다. 또한 코어의 불량 문제에 있어 취약했다. 또한 각 코어 간의 연결이 FSB로 이어지므로 성능에 이득 또한 없었다.

프레슬러에서 사용한 멀티칩 패키징은 성능상의 손해가 없으면서도 이런 생산 비용적 문제들을 모두 해결할 수 있었다. 생산은 시더밀 코어만을 생산하면 되었고, 불량 면에서도 손실이 더 적어졌다. 또한 시더밀에서 줄어든 전력 소비와 발열은 같은 코어를 사용하는 프레슬러에서도 그대로 이어졌다.

프레슬러 기반의 익스트림 에디션에서는 차별화를 위해 더 높은 FSB를 사용했다. 이 프로세서는 1066MHz FSB를 지원하는 975X와 조합되었으며, 클럭은 3.46GHz와 3.73GHz 두 종류가 출시되었다. 전통 아닌 전통이지만, 언제나 익스트림 에디션은 제온 라인업과 관계가 있었고, 이번 익스트림 에디션은 제온 5000 시리즈의 축소판이라고 할 수도 있다.

제온 라인업의 완전한 분리

넷버스트 아키텍처의 시대에 와서 제온 라인업은 완전히 분리되었다. 이는 펜티엄 3까지와는 달리 펜티엄과의 차별화가 완전히 이루어졌기 때문이다. 펜티엄 계열은 메인스트림에서 하이엔드 정도까지의 일반 유저를 대상으로 했으며, 제온 계열은 워크스테이션과 서버 시장을 본격적으로 공략하기 시작했다.

제온 계열이 가지는 펜티엄 계열과의 가장 큰 차이는 듀얼, 멀티프로세서 지원이다. 펜티엄 4는 애초에 싱글 프로세서만을 사용할 수 있지만, 제온 프로세서는 기본적으로 듀얼 프로세서 구성을 지원하며, MP 모델들은 쿼드 구성이나 그 이상까지도 지원해 내기도 했다.

또한 제온 계열에서는 32비트 환경에서도 4GB 이상의 메모리를 활용할 수 있었다. PAE를 통해 가능했는데, 이를 지원하는 프로세서, 메인보드, 운영체제의 조합으로 64GB 정도까지 사용이 가능했다. MP 모델 중 일부는 이 메모리 어드레싱 영역이 1TB 이상으로 대폭 증가해 대용량 서버에도 대응되었다. 이런 기능들 덕분에 제온 프로세서를 위한 메인보드 칩셋 라인업 또한 완전히 분리되었다.

제온 계열은 각 공정별로 데스크톱의 펜티엄 4 프로세서들과 같은 코어를 공유하나 특징은 존재한다. 이색적인 포스터 MP (Foster MP), 갤러틴(Gallatin)과 포토맥(Potomac) 등이 존재했다. 이들은 L3 캐시까지 갖추고 대용량 서버까지 대응되었다. 갤러틴의 경우 멀티프로세서 지원을 제외하고 소켓을 바꿔 익스트림 에디션으로 출시되기도 했다. 한편 '포스터 MP'에는 초기형의 HT 기술이 들어가 있었다.

저전압 제품들도 출시되었는데, MV는 Medium Voltage, LV는 Low Voltage의 약자이다. 동작 전압을 낮추어 발열을 줄였으며, 주로 방열 환경이 취약한 소규모의 랙 형태 서버나 블레이드 서버에서 사용되었다. 이 당시에는 스몰 마켓 정도로 인식되던 분야였으나, '그린 IT' 이슈가 본격화하면서 인텔에게 있어 매우 중요한, 선도적인 제품군으로 각광받게 된다.

듀얼 코어 제온 계열 또한 펜티엄 D계열과 마찬가지로 싱글 코어들의 구조를 공유하는 방법으로 만들었으며, 기존 제품군처럼 듀얼 프로세서 제품군과 멀티프로세서 제품군으로 나뉘어 있었다. 제온 계열에서 듀얼 코어의 의미는 데스크톱의 듀얼 코어보다 더 각별했는데, 데스크톱에서의 듀얼 코어가 ‘쉽게 맛보는 듀얼 프로세서’라면, 서버에서의 듀얼 코어 프로세서는 ‘코어 개수만큼의 처리용량 증가’라서다.

이 라인업의 특징이라면, 데스크톱 라인업은 이 시기에 이미 소켓 형태가 소켓 478을 건너 LGA775로 건너간 시기이지만, 제온 계열은 소켓 604를 듀얼 코어 초기까지 끌고 갔다는 것이다. 이는 기존 서버의 플랫폼 업그레이드가 쉽지 않은 현실을 반영하여 최대한 플랫폼 교체를 줄이는 방향으로 제품이 디자인되기 때문이다. 하지만 결국 제온 또한 2006년 이후 LGA771로 출시되게 된다.

한편, 이 시기에 펜티엄 4와 마찬가지로 제온 또한 클럭 표기법 대신 제품 번호를 사용한 표기가 이루어진다. 현재 제온 표기는 네 자리 숫자로 표기하는데 첫 자리는 최대 프로세서 지원 개수, 두 번째 자리는 사용된 코어의 세대, 세 번째 자리와 네 번째 자리는 계열 내에서의 위치와 부가기능 등을 나타낸다. 첫 자리 3은 싱글 프로세서만을 지원하며, 5는 듀얼 프로세서, 7은 기존의 MP 모델에 대응되는 것이다.

이 당시에 나왔던 듀얼 코어 제온 프로세서는 5시리즈와 7시리즈 뿐이다. 이 당시까지의 제온 프로세서는 기본적으로 듀얼 프로세서 이상의 구성을 지원했었기 때문이다. 3시리즈의 제온 프로세서는 코어 아키텍처 이후에 처음 등장하게 된다.

한편, 이색적인 제품으로는 제온 7100 시리즈가 있다. 코드명 Tulsa, 제온 7100 시리즈는 대용량의 공유 L3 캐시를 사용하였고, 65nm에서 기존의 프로세서와는 차원이 다른 집적도를 보여주었다.

N라인업은 667MHz의 FSB, M라인업은 800MHz의 FSB를 사용하였고, 최상위 모델에서는 16MB의 L3 캐시를 장착하였다. 넷버스트 기반의 듀얼 코어 제온 라인업에서 유일하게 L3 캐시를 장착하고 있었다. 이 덕분에 65nm 공정임에도 코어 사이즈는 매우 컸다.

모바일 플랫폼의 완전한 분리

넷버스트 아키텍처의 고클럭과 높은 전력 소비는 모바일에 있어 치명타였다. 저전력소비가 미덕인 모바일 플랫폼에서, 모바일 버전의 펜티엄 4가 보여주는 전력 소비량은 도저히 소비자가 용납할 수 있는 수준을 넘어선 것이었다.

넷버스트 시절 인텔의 모바일 프로세서들은 모바일이라 하기엔 민망할 정도로 심한 전력소비를 보여준다. 프레스캇 코어를 사용한 모바일 펜티엄 4는 88W의 TDP를 보여 주는데, 이는 왠만한 데스크탑 프로세서보다 많은 전력 소비이다.

이를 해결하기 위해 EIST등을 적용했음에도 효과는 크지 않았는데, EIST를 적용할 경우 클럭과 전압을 낮추어 소비전력을 낮춘 건 좋았지만 낮은 효율로 인해 실제 사용이 힘들 정도의 성능이 나오는 것은 극복할 수 없는 문제였다.

심한 전력소비와 낮은 효율 때문에 모바일 버전의 펜티엄 4는 일반적으로 데스크톱 대체나 풀 사이즈 레벨의 제품에 주로 채택되었고, 튜알라틴 코어 기반의 펜티엄 3 모바일 프로세서는 이후 센트리노(Centrino) 플랫폼이 발표될 때까지 생명을 이어가게 되었다.

모바일 펜티엄 4 시리즈는 노스우드 시리즈에서 이름이 한번 바뀌었다. 펜티엄 4-M에서 모바일 펜티엄 4로 바뀌었는데, 이는 센트리노 플랫폼에서 ‘펜티엄-M'을 프로세서 이름으로 사용하였기 때문에 혼란을 피하기 위해 이름의 순서를 살짝 바꾼 것이다.

모바일 셀러론 또한 2.5GHz 이상의 제품은 명맥이 끊어져 버렸다. 이 프로세서는 데스크톱의 노스우드 코어 기반 셀러론에 비해 L2 캐시가 많았고, 더 좋은 성능을 보여 주었지만 셀러론의 한계를 넘을 수는 없었다. 또한 전력소비량의 벽을 넘기에도 역부족이었다.

한편, 센트리노 플랫폼이 등장하면서, 전력소비 대비 성능에서 밀린 펜티엄 4 모바일은 급격히 자취를 감추게 되었다. 펜티엄 4 모바일 프로세서들은 모바일 플랫폼이 아니라 데스크톱 대체의 풀 사이즈 랩탑이나, 비교적 저전력이 필요한 데스크톱 시스템에까지 들어가게 되었지만 그 수요는 적었고, 실질적으로는 넷버스트 아키텍처에서 모바일 프로세서는 없는 셈 쳐도 좋을 상황이 되었다.

시장의 큰 기대를 받으며 등장한 센트리노 플랫폼은 P6 아키텍처 기반의 고효율과 모바일에 어울리는 저전력소비를 무기로 빠른 속도로 시장을 대체해 갔다. 인텔은 센트리노 플랫폼이 있는 상태에서 '모바일 펜티엄 4'를 이어갈 필요가 없었다. 자의든 타의든, 센트리노 플랫폼이 나오면서 모바일과 데스크톱 플랫폼은 완전히 분리되었다. 추후 MoDT 같은 파생이 있긴 했으나, 한국에서는 금새 사라졌다.

  Copyright ⓒ Acrofan All Right Reserved
반응형

댓글