본문 바로가기

디지털기기 정보

[번역자료] 모바일이 바뀐다!? Centrino Atom 입문 (후편)

미국 인텔사의 초저소비전력  CPU [Atom] 프로세서와, Atom프로세서를 핵으로 한 모바일기기용 플랫폼 [Intel Centrino Atom 프로세서 테크놀러지] (이하 Centrino Atom).

사용자 삽입 이미지

Atom 프로세서(좌)와 SCH(우), 1엔 동전의 사이즈 비교. Atom은 1엔동전보다 작다


Centrino Atom이란 무엇인가를 해설한 본 특집의 전편에서는 Centrino Atom이 어떤 플랫폼이며 어떻게 이용되는가를 설명했다. 후편에서는 Atom 프로세서의 아키텍쳐와 전용 칩셋 (Poulsbo)의 상세사항에 관해서 설명하겠다.


트랜지스터를 줄여서 저소비전력

Atom은 기존의 인텔 CPU와 달리, 저소비전력/저발열로 어느 정도의 퍼포먼스를 노린 프로세서이다.
제조 프로세스는 최신 Core 2 Duo 프로세서 (Penryn 패밀리)와 같은 45nm 프로세스를 채용하고 있다

사용자 삽입 이미지

Intel Atom 프로세서

[Atom이 저소비전력을 실현하고 있는 것은 트랜지스터 수가 작은 것이 큰 포인트 입니다. 최신 Core 2 Duo의 트랜지스터 수는 약 4억1천만개이지만, Atom에서는 약 4700만개입니다. Core 2 Duo와 비교하면 약 1/9의 트랜지스터 수 밖에 없습니다. 여기의 최신 45nm제조 프로세스가 들어가 저소비전력을 실현하고 있습니다. 물론 트랜지스터 수가 작아지만 프로세서의 비용도 저렴해집니다] 라고 인텔(주) 인텔 기술부장은 언급했다.



사용자 삽입 이미지

Atom 프로세서의 다이 사진

실제 Atom의 최고속품인 Atom Z540은 클럭 주파수 1.86GHz이면서 2.4W의 TDP를 실현하고 있다. 이것은 노트PC용의 초저소비전력판 Core 2Duo프로세서(1.33GHz,10W)는 물론, UMPC용 CPU로서 출시된 Intel A100/A110 프로세서에 비해서도 상당히 소비전력이 낮다.

Atom과 Intel A100/A110의 주된 사양

사용자 삽입 이미지


예를들면 Intel A110은 90nm 프로세스의 Pentium M 계 CPU 코어를, 800MHz 저클럭으로 동작시켜서 3W의 TDP를 실현하고 있다. CPU 아키텍쳐나 제조 프로세스의 차는 있지만 Atom은 A110의 2배 가까운 클럭을 실현하면서도 TDP는 A110에서 80%씩이나 낮아졌다.



Atom의 아키텍쳐

Atom은 현재 인텔의 CPU의 주류인 [Core 마이크로 아키텍쳐]나 Pentium 4의 [NetBurst 아키텍쳐]와는, 전혀 다른 새로운 아키텍쳐이다.

사용자 삽입 이미지

Atom의 블럭도(인텔 자료로부터 인용.이하도 같음). 소량이 2차캐시, 인오더 형의 아키텍쳐로 트랜지스터 수를 감소했다.



Atom의 컨셉은 앞에 언급한 대로, 트랜지스터 수를 작게 해서 고클럭/어느정도의 퍼포먼스를 확보하는 것이다. 그때문에 CPU자체를 심플하게 했다. 하지만 CPU를 심플하게 하면 그만큼 퍼포먼스도 낮아질수 밖에 없다.

여기서 Atom에서는 퍼포먼스를 내기 위해 임베디드용 CPU로서는 지금까지 없을 정도의 고클럭으로 동작하고 있다. 가장 느린 Atom Z500에서는 동작클럭이 800MHz로 TDP도 0.65W로 상당히 낮다. 게다가 Atom Z520이상에서는 하나의 CPU코어로 2개의 스레드를 실행시키는 [Hyper Threading Technology](HT)를 채용하여 퍼포먼스를 올리고 있다.


사용자 삽입 이미지

Atom 프로세서의 기능. 퍼포먼스는 A110에서 그만큼 향상하지는 않지만, 소비전력감소와 저가격화에 주력하고 있다.

HT가 작동하는 경우, CPU내의 연산기는 효율적으로 작동하여 퍼포먼스는 올라가지만 소비전력도 올라간다. 이에 관해 인텔 기술부장은 이렇게 말한다 [확실히 Atom에서 HT를 이용하면 CPU가 풀 회전하기 때문에 TDP면에서는 디메리트가 됩니다. 하지만 시간축에서 CPU의 동작을 보면, HT로 퍼포먼스가 필요한 부분의 처리를 단기간 끝내서, 가능한한 빨리 저소비전력 모드로 이행하는 편이 전체적으로 보면 저소비전력화에 기여하고 있습니다. 저속으로 장시간처리를 하는것보다 빠르게 처리를 끝내고 바로 쉬는 쪽이 메리트가 있는 겁니다]

HT를 채용한 이유는 싱글코어 CPU인 Atom의 퍼포먼스를 향상하면서 장래적으로 듀얼코어 CPU화 하려는 생각도 있다고 예상된다. 듀얼코어판 Atom이 TDP 3W에 들어간다고는 생각되지 않지만 (8W정도라고 추측되고 있다), 차세대 32nm제조 프로세스로 이행하면 TDP 3W도 목표에 들어올 수 있을 것이다.

Atom의 저소비전력화는 [C6스테이트] (Deep Power Doen)이라고 불리는 새로운 전력소비모드의 사용도 기여하고 있다고 한다. C6스테이트는 코어전압, 코어클럭, PLLL(동기회로), 1차/2차 캐시매모리 등을 OFF하여, 소비전력을 대폭으로 내려 거의 전력을 소비하지 않는다.
참고로 Penryn 패밀리의 Core 2 Duo/Quad도 C6스테이트를 지원하고 있다.


사용자 삽입 이미지

Atom에서는 Penryn에 채용된 [C6스테이트]가 도입되어 있다. CPU의 이용시간의 90%가 C6스테이트가 되기 때문에 대폭적인 저전력화가 기대된다.


PC의 사용 상황을 생각해보면 많은 시간이 입력대기 상태가 된다. 역으로 말하면 소비전력이 적은 상태가 길게 지속되는 것이다. 다시말해 C6스테이트가 들어가서 CPU의 소비전력이 압도적으로 낮아진다. 인텔에서는 일반적 PC 사용시에 C6스테이트에 들어가는 시간은 90%까지 올라간다고 말하고 있다.

Atom은 1차 명령 캐쉬가 32KB, 1차 데이터 캐쉬가 24KB, 2차 캐쉬는 512KB 탑재하고 있다. 시스템 버스 (FSB)는 133MHz(Atom Z500은 100MHz). HT나 64bit 확장명령인 [Intel 64]외에 가상화를 지원하는 버철라이제이션 테크놀러즈 SSE3과 확장SSE3(Core 2 Duo에서 지원)등, Core 2 Duo와 동등의 기능이 지원되고 있다. Atom이라고 해서 최신 CPU의 기능이나 명령 세트를 쓸수 없다 라는 것은 아니다.


Atom은 Core 2 Duo와 뭐가 다른가?


Atom 아키텍쳐는 Core 2 Duo의 Core 마이크로 아키텍쳐와 어떤 부분이 다른가?
가장 다른 것은 Atom에서는 [인 오더] 형의 명령실행방식을 채용하고 있다는 것이다.

Core 2 Duo와 Pentium 4는 [아웃 오브 오더]형의 실행명령방식을 채용하고 있다.
아웃오브오더 형에서는 CPU코어 내부에서 프로그램을 분석해서 처리에 필요한 데이터가 모이고 실행할수 있는 명령부터 먼저 실행하도록, 명령의 실행순서를 재배열해서 실행한다.
명령이 나열되어 있는 순서대로 실행하는 것은 아니다. 순서(Order)를 무시해서(Out) 실행할수 있는 명령부터 먼저 처리하여 CPU의 움직임을 멈추지 않고 실행해서 처리성능을 높이고 있다.

반면 Atom 프로세서에서 채용하고 있는 인 오더 형은 프로그램의 순서에 따라 처리한다. 그때문에 실행에 필요한 데이터가 모이지 않으면 CPU 동작은 기다려진다=처리속도 저하로 이어진다.

아웃오브오더 형은 실행효율이 좋은 반면 명령의 재배열(스케줄링)등에 많은 트랜지스터가 필요해진다. 이때문에 트랜지스터 수를 컴팩트하게 하고싶은 Atom에서는 인오더 형을 채용했을 것이다.

한편, Atom에서 HT를 채용한 것은 명령을 실행할 수 없어 CPU가 기다려지는 때에도 HT로 인해 다른 스레드의 명령을 실행할수 있다는 의도라고 생각된다. 이걸로 인오더형에서도 가능한한 코어부분이 쓸데없이 기다려지지 않게 될수 있다.

그외 Core 마이크로 아키텍쳐와의 차이를 보자면, Atom에서는 x86명령을, μOPS와 같은 세세한 내부명령에는 변환하지 않는 점을 들수 있다. 또한 분기명령이 있는 경우 미리 분기 앞부분까지 실행해두고 실제로 분기가 일어났을때 어느한쪽을 채용하는 [투기실행]기능도 채용되지 않고있다.

사용자 삽입 이미지

Atom의 파이프라인 편성, 코어 구동이 전압 1V에서도, 2GHz까지 클럭을 올릴수 있다.



Atom 내부의 파이프라인은 Core 아키텍쳐의 14단계에서 16단계로 올라가 있다. 단, 인오더 형으로 튜닝되어 있는 부분이 있기 때문에 거의 Core 아키텍쳐와 같다고 말해도 좋다. 참고로 Pentium III 세대에서는 10단계였다. 파이프라인의 단수를 올리는 것으로 고클럭 동작에 적합한 설계가 채용된 것이다. 파이프라인에 관해서는 Core 마이크로 아키텍쳐의 컨셉을 Atom도 계승했다고 말할수 있다.

Atom의 내부를 보면, Pentium III세대의 아키텍쳐를 베이스로 [Core마이크로 아키텍쳐의 좋은 부분을 채용한 것이 Atom]이라는 인상을 받는다.



Atom용으로 설계된 칩셋 [SCH]


사용자 삽입 이미지

SCH칩셋 (오른쪽 위)와 Atom. 90nmm프로세스로 제조되어, 기능도 많기 때문에 칩셋 쪽이 더크다.


앞편에 언급한 대로, Centrino Atom은 Atom 프로세서와 Atom전용으로 디자인된 인텔 시스템 컨트롤러 허브(이하 SCH)로 편성된다.


사용자 삽입 이미지

Atom과 SCH에 연결되는 기기의 기본구성도. SCH에는 GPU부터 메모리 컨트롤러, I/O까지 많은 기능이 들어가 있다.



SCH는 GMCH(그래픽 메모리 컨트롤러 허브, 흔히 말하는 노스 브릿지)와 ICH(I/O컨트롤러 허브, 흔히 말하는 사우스 브릿지)의 기능을 1칩에 통합 한 것이다. 이하와 같이 3종류의 배리에이션이 라인업 되어있다.


SCH의 라인업

사용자 삽입 이미지


SCH는 Atom과 마찬가지로 C6스테이트를 서포트 하고 있다. SCH자체도 각 블럭을 모듈화 해서, 동작하지 않는 부분의 전원을 OFF하는 기능을 가져, 동작시의 소비전력을 작게 하고 있다.


사용자 삽입 이미지

SCH의 기본기능. 특히 내장 그래픽 기능이 강력해져 있다.


SCH는 DirectX9와 OpenGL을 지원하는 그래픽기능(GPU)[Intel GMA500]을 내장하고 있다. GMA500은 인텔의 독자개발품이 아닌, Imagination Technology사의 [POWERVR SGX]코어를 채용하고 있다. POWERVR이라고 하면 그리운 옛날 가정용 게임기 [드림캐스트]에도 채용되었던 GPU이다. SCH의 POWERVR SGX는, 당연히 드림캐스트 시대의 것부터 수새대 진화한 것이다. 인텔 데이터 시트에 따르면 Shader Model 지원은 "3.0+"라고 기재되어 있다. (Geforce 6~7세대와 동등)

GMA500은 디스플레이 출력으로, LVDS와 Serial DVO(SVDO)의 2종류를 지원하고 있다. LVDS는 온보드 디스플레이 출력으로, DVI출력이나 HDMI출력에 사용된다. 해상도는 1366x768도트(24bit칼라). SDVO출력은 추가 디스플레이 출력용으로 1280x1024도트 혹은 720P/1080i 디지털/아날로그 출력에 이용된다 (가장 저소비전력인 UL11L은 800x480도트)

그리고 GMA500에는 Imagination Technology사의 비디오 재생 지원기능인 [POWERVR VXD]도 탑재되어 있다. 이 비디오 재생지원 기능에는 H.264/VC1(WMV9)/MPEG-2/MPEG-4 등 메이저한 비디오 코렉의 재생을 하드웨어가 담당한다. 이때문에 CPU파워가 별로 없는 Atom탑재 머신에서도 SCH와 조합하면 HD퀄리티의 영상을 재생할 수 있다.

모바일용이면서 HD비디오가 재생되는 것은, SCH를 단순한 모바일PC용 뿐만이 아닌, 더욱 넓은 분야에 이용할려고 생각하고 있는 것일 것이다.

탑재 메모리에 관해서는 DDR2-533/400의 최대 1GB까지 되어있다. Windows를 동작하기 위해서는 메인 메모리가 최대 1GB라는 것은 부족하다. 하지만 Linux베이스의 임베디드용 기기 OS를 이용하기에는 충분할지도 모른다.



Centrino Atom의 로드맵은?


전편에서도 언급했지만, 인텔은 2009년에 차세대 Centrino Atom인 [Moorestown](무어즈타운)플랫폼의 출시를 예정하고 있다. Moorestown 플랫폼은 CPU[Lincroft](린크로프트), 칩셋[Langwell](랑웰), 무선랜 칩의 [Evans Peak](에반스피크)등으로 구성된다.

사용자 삽입 이미지

2009년 출시되는 Moorestown플랫폼에서는 주요 칩은 4개로 정리된다.


새로운 CPU인 Lincroft는 이번의 Atom을 베이스로, CPU측에 GPU와 메모리 컨트롤러가 통합된다. 한편 칩셋인 Langwell에는 각종 I/O나 SSD컨트롤러 등이 통합된다. CPU성능도 Lincroft에서는 Intel A100에서 40%정도 향상된다고 한다.


사용자 삽입 이미지
현행 Menlow와 Moorestown의 퍼포먼스나 TDP를 A100과 비교한 표. Moorestown에서는 40%나 성능이 향상된다.

또한 무선칩인 Evans Peak에서는 무선랜 뿐만이 아니고 WiMAX나 Bluetooth, GPS등도 탑재된다. 옵션기능은 3G휴대전화나 모바일TV등의 기능도 준비된다고 한다.

Moorestown의 최대 메리트는 모든 칩을 탑재한 마더보드 부분이 신용카드 크기에 들어갈 정도 컴팩트해지는 것이다.
이정도로 소형화되면 여러가지 폼팩터의 MID(Mobile Internet Device)가 등장할 것이다. Evans Peak에서 TV수신 기능이 서포트 되면, 원세그 방송수신기능이 달린 휴대전화기에도 사용될수도 있다.
게다가 Moorestown의 플랫폼은 소비전력도 현세대(Menlow)의 1/4이 되고, 아이들시의 소비전력은 1/10이 될 계획이다.

사용자 삽입 이미지

Moorestown에서는 마더보드가 신용카드 크기까지 축소된다.



Atom자체로는, 6월 3일부터 대만에서 개최되는 [Conputex Taipei 2008]에서 저가격 PC용 Atom [Diamondville]이 정식발표된다. Diamondville의 듀얼코어판도 발표될것으로 보인다.


Centirno Atom에 적합한 기기는?

Centrino Atom은 MID 플랫폼 용이지만 실제로 MID를 만드는데는 OS나 어플리케이션이 문제가 된다. SCH가 메모리를 1GB밖에 지원하지 않는 것을 생각해보면 Centrino Atom머신에서 Windows Vista를 돌리는 것은 상당히 힘들다.
Windows XP에서도 메모리가 충분하다고는 말할수 없다.

그렇게 되면, Centrino Atom머신은 OS에 Linux를 채용하여, 특정한 임베디드 어플리케이션만을 움직이는 MID가 중심이 되지 않을까?
일부에서는 Windows Vista나 XP를 탑재하는 UMPC도 나오지만, 퍼포먼스 부족을 피할수 없는 상태에서는 일본에는 별로 많이 퍼지지는 않을거라고 필자는 생각하고 있다. Windows 베이스의 MID나 UMPC는 Moorestown 플랫폼부터 본격적이 될것 같다. 이번의 Centrino Atom은 어떤의미로, 대규모 테스트 제품일지도 모른다.


사용자 삽입 이미지


IDF2008 상해에서 출전했던 대만 USI의 MID [Delore]. OS는 Linux베이스의 비 Windows형 MID의 전형적인 예이다. Vista를 탑재하는 WILLCOM D4와 비교하면 성능도 낮지만 그만큼 저렴하다.

Computex Taipei에는 Diamondville을 사용한 저가격 PC [Netbook] [Nettop]의 많은 수가 발표될 것이다. Diamondville은 저가격 PC를 본격적으로 제품 장르로서 확립시켜주지 않을까?


사용자 삽입 이미지

인텔이 상정하는 Nettop의 블럭도. CPU가 Diamondville인것을 제외하면 2세대전의 PC와 거의 동등하다.


조금 마음에 걸리는 것은, Diamondville과 짝을 이루는 칩셋이 PC용으로는 구세대인 Intel 945G 시리즈인 점이다. 그래픽부터 I/O쪽의 성능까지 최신 칩셋과 비교하면 기능이나 성능에서 떨어져 보인다. 칩셋의 제조 프로세스도 오래되었기 때문에 소비전력도 크다.
Netbook/Nettop 시장이 본격적으로 떠오르면 Netbook/Nettop에 최적화된 칩셋이나 메모리 용량을 확장한 SCH등을 제공하는 것도 좋지 않을까?


출처 : ascii.jp