본문 바로가기

디지털기기 정보

[번역자료] 평균소비전력을 수백mW로 낮춘 Silverthorne

* 통상전압판과 중전압판, 저전압판이 있는 Silverthorne

Intel은 휴대기기용의 새로운 x86 CPU[Silverthorne(실버손)]을 올 봄 (2008년 봄) 투입한다.
4월의 Intel Developer Forum(IDF)경에 프로세서 자체를 발표하고, 6월경까지 제품의 발표를 할 예정이다.

Silverthorne의 타겟이 되는 것은 Intel이 [MID(Mobile Internet Device)]라고 분류하는 휴대기기. 스마트폰보다 큰 사이즈고 노트PC보다 작은 사이즈. 4.5~7형 정도의 액정을 갖추고, 무게는 수백g, 무선통신기능을 갖추고, Windows나 Linux를 탑재하고, 다양한 어플리케이션을 돌릴 수 있는 머신이다. 넓은 의미의 MID 중에는 Windows를 탑재하고 Windows의 유저 인터페이스를 사용하는 [UMPC(Ultra Mobile PC)]도 포함되어 있다. 좁은 의미의 MID는 UMPC 이외의, Linux등의 OS를 사용하는 디바이스로, Silverthorne의 중심 타겟은 여기에 있다.

Intel은 2월3일~7일에 걸쳐서 미 샌프라시스코에서 개최된 [ISSCC(IEEE International Solid-State Circuits Conference) 2008]에서 MID나 UMPC에 요구되는 CPU의 TDP(Thermal Design Power:열설계소비전력)은 0.6~2W의 범위라고 설명했다. Silverthorne은 그 범위에 맞춰서 설계되었다고 한다.

실제 Intel은 Silverthorne을 0.6~2W의 SKU에서 투입할 생각이다. 적어도 작년(2007)말의 계획에서는 3단계의 TDP제품 패밀리는 내놓을 예정으로 되어있었다. 전압은 통상레벨로 고주파수의 통상전압(Standard Voltage)판, 더 전압을 낮춘 중전압(Medium Voltage)판, 더더욱 전압을 낮춘 저전압(Low voltage)판의 3개이다. 오리지날 계획에서는 통상전압판이 1.02V에서 2W에 1.86GHz, 중전압판이 0.85V에서 1W에 1.1GHz, 저전압판이 0.77V에서 0.6W에 0.9GHz의 예정이었다. 게다가 통상전압판에 관해서는 1.6GHz로 내려갔다는 정보도 있다.

Silverthorne과 마찬가지 [Bonnell(본넬)] CPU코어를 사용하는 PC용[Diamondville(다이아몬드빌)]과 휴대기기용 Silverthorne도 함께 1.6GHz로 주파수가 내려가 있다. 1.86GHz에서 동작시킨 경우 TDP범위에 들어가기 위한 제품의 효율이 나빴을 가능성이 있다.

하지만 만약 주파수가 1단계 내려갔다고 해도, 타겟으로 하는 TDP가 0.6~2W의 범위에서 바뀌는 가능성은 낮다. 또한 전압 스펙도 물리적으로 이것보다 내려가는 것은 어렵다. 그때문에 동작주파수가 아래로 내려간다고 해도, TDP와 전압은 거의 같다고 추정된다.


사용자 삽입 이미지

Silverthorne의 레이아웃


 

* Silverthorne의 평균소비전력은 수백mW


Silverthorne이 타겟으로 하고 있는 휴대정보단말기에서는 배터리 구동을 위해 평균소비전력의 감소가 상당히 중요하다. Silverthorne에서는 대응 칩셋[Poulsbo(폴스보)]와 합친 평균소비전력을 1W이하로 낮춘다고 한다. 칩셋 측에서 600~800mW를 소비하기 위해, Silverthorne의 전력소비는 평균 400mW이하로 낮추지 않으면 안된다는 계산이 된다. ISSCC에서도 Silverthorne의 평균소비전력은 수백mW(a few hundered mW)가 된다고 설명되었다.

종래의 Intel의 최저소비전력 PC용 CPU의 수분의1의 전력소비를 실현하기 위해, Silverthorne에서는 상당히 가치있는 저전력기능을 갖추고 있다. 그 전력제어기술은 Intel이 모바일 PC용 CPU에서 개발한 전력절약기술의 집대성+알파로 되어있다.

우선 Silverthorne에서도 Intel의 모바일 PC용 CPU와 마찬가지로 CPU부하에 따라서 주파수와 전압을 전환하는 SpeedStep이 장비되어 있다. CPU부하가 높은 상태에서 Silverthorne은 액티브상태의 [C0(Active)]스테이트의 HFM(High Frequency Mode)로, 고동작주파수로 고전압 상태가 된다. 이것이 전에 언급한 전압과 고주파의 스펙의 모드이다.

부하가 떨어지면 Silverthorne은 단계적으로 주파수와 전압을 전환해서 C0 LFM(Low Frequency Mode)로 전환되어, 코어의 동작주파수와 전압이 C0의 최저라인으로 떨어진다. 통상전압판의 LFM은 0.95V에서 1.3GHz가 예정되어 있지만, 이것은 변경될 가능성이 있다. Medium이면 0.8V, Low라면 0.75V가 된다. 통상전압판의 LFM에서의 TDP는 0.8W 이하이다. Silverthorne에서는 이 0.8V 근처 까지가, 퍼포먼스와 전압의 밸런스가 좋은 범위이고, 그것보다 내려가면 퍼포먼스가 뚝 떨어져버린다. 이때문에 LFM의 최하는 0.75에서 0.8V로 할 수 밖에 없을 것이다.


사용자 삽입 이미지

Silverthorne의 동작주파수



사용자 삽입 이미지

Silverthorne-Poulsbo 시스템




* 단계적인 C스테이트로의 전환

CPU가 아이들 상태로 들어가면 CPU코어 클럭의 공급이 정지되고 [C1(Halt)][C2(Stop Clock)] 스테이트로 들어간다. C1은 전력은 별로 내려가지 않지만, 복귀도 빠르다. Silverthorne 에서 C1에서는 1마이크로 초 이하의 레이턴시로 복귀할 수 있다고 한다. Silverthorne은 Hyper-Threading이라서 스테이트는 각 스레드마다 전환된다. 스레드의 스테이트가 갖춰지면 CPU전체의 스테이트가 전환되는 방식이다.

여기서 더욱 아이들 상태가 계속되면 [C3(Deep Sleep)]로 들어가, CPU코어의 L1에디터 캐쉬가 프래시되어 L2캐쉬로 덤프된다. C3상태의 CPU코어의 L1은 텅 비게 되므로, CPU코어의 L1캐쉬로의 스누프의 필요가 없어진다. 이 때의 전력은 통상전압판에서 0.6W, 중전압에서 0.4W, 저전압판에서 0.3W가 된다.

다음 [C4(Deeper Sleep)] 스테이트로 들어가면, CPU의 공급전압이 캐쉬의 데이터 내용을 유지할 수 있는 한계레벨(Cache retention)으로 떨어진다. 통상전압판의 경우는, 미니멈으로 0.75V(Vccdprslp)가 된다. 이 때의 전력소비는 최대가 통산전압판에서 0.5W, 중전압판,저전압판에서 0.3W이다. ISSCC에서의 차트를 보면 C1/2때의 1/3이하이므로, 실제로는 더욱 내려갈 것이다. 단, 전력소비가 내려가는 만큼 C4스테이트에서의 복귀에 걸리는 레이턴시도 늘어난다. ISSCC에서의 설명으로는 Silverthorne의 C4에서의 복귀는 30마이크로 초 정도 걸린다고 한다.

C4로 들어가면 L2캐쉬 내용은 계속해서 메인메모리에 쓰여지며 플래쉬된다. 게다가 [Dynamic Smart Cache Sizing]에 의해, 플래쉬된 라인 단위로 캐쉬어레이가 오프되어 간다. 마지막에는 L2가 완전히 텅비게 되고 모든 L2캐쉬가 파워오프 된다. 캐쉬 SRAM의 전력소비의 많은 부분을 차지하는 것은 리크 전류(Leakage). Silverthorne에서는 L2캐쉬가 슬립되어 0.75V가 되면 리크전류가 1/2.5로 내려가고 셧오프 되면 리크 전류가 1/10까지 내려간다. 완전하게 캐쉬가 텅 비고 오프되면 [C6(Deep Power Down)] 스테이트로 전환된다.


사용자 삽입 이미지


사용자 삽입 이미지

스테이트 별 소비전력




사용자 삽입 이미지

Silverthorne의 C스테이트





* Silverthorne의 저소비전력화를 결정짓는 C6의 장착

C6스테이트에서 전압은 캐쉬리텐션레벨보다 낮은 레벨로 내려간다. ISSCC에서는 이 때의 전압은 0.3V라고 발표되었다 (고객에게는 0.35V라고 설명되었다) 전압을 0.3V대로 내리게 되면, C6스테이트에서는 소비전력은 0.1W이하로 내려간다. 종래 CPU의 경우, 여기까지 전압을 낮추면, CPU의 아키텍쳘 스테이트가 사라져 버린다. 그렇다고, 스테이트를 CPU외부의 메모리에 보존하면, 웨이크 업 때의 스테이트를 CPU로 되돌리는데 큰 시간이 걸려버린다. 이것은 전력절약 모드로는 실용적이지 않다.

이 때문에 Intel은 Silverthorne에서는 CPU 다이(반도체본체)상에 10.5KB의 온다이 전용 SRAM을 [State Storage]로서 장착했다. Silverthorne에서는 C6스테이트에 들어가기 전의 C4스테이트 때에 CPU 스테이트가 이 SRAM에 저장된다. 다시말해 마이크로 코드의 스테이트의 대부분이 포함된다. 이때문에 CPU의 스테이트 보존을 고려할 일이 없이 코어 스테이트 보존 레벨 이하의, 더욱 낮은 전압으로 내릴 수 있다. 참고로 Penryn에서는 State Storage SRAM은 8KB/코어 라, Silverthorne쪽이 SRAM양이 많다. 아웃 오브 오더 실행의 Penryn 쪽이 마이크로 아키텍쳐 상의 스테이트는, 인 오더 방식의 Silverthorne보다 많을 것 같지만 그렇지 않다. 이것은 Hyper-Threading에 의해 스테이트의 일부가 2중화 되어있기 때문이라 생각된다.

이 SRAM은 CPU의 다른 영역과 다른 파워 플렌으로 되어 있다. CPU 전원전압(Vcc)가 어디까지 내려가도, Vcc와는 독립된 I/O전압 [VccP](1.05V)가 공급되어 있다. Silverthorne의 경우에는 [Split-Vccp]에 따라서 C6때에는 90%에 해당하는 182개의 I/O핀의 전압을 내리고, 겨우 21핀의 전압 (Vccpc6)만이 보존된다. 이것으로 I/O 리크전류를 최저로 낮출 수 있다고 한다.

사용자 삽입 이미지

C6에서는 Silverthorne의 소비전력은 대폭으로 감소된다. 하지만 복귀 레이턴시가 더욱 길어진다. CPU코어의 마이크로 컨트롤을 리셋하고, 양 스레드의 스테이트를 복구해야 하기 때문이다. Silverthorne에서는 이 복귀에 100마이크로 초 정도 걸린다고 한다. 참고로 작년(2007년)8월의 CPU 컨버런스[Hotchips]에서는 Penryn의 경우, C6에서의 복귀에 150~200마이크로 초 가 걸린다고 설명했다.

ISSCC에서의 설명에는 전형적인 Usage 모델에서는 Silverthorne의 구동시간중 최대 90% 까지가 C6스테이트가 된다고 한다. 그에 반해 C0 액티브 스테이트는 겨우 수% 정도. 이때문에 C6의 장착으로 인해 평균소비전력이 극적으로 내려가는 것이 가능하다고 한다.


* 회로기술이나 프로세스 기술도 저소비전력화에 맞춘다.

Silverthorne에서는 이러한 세세한 전력제어를 하는 것 뿐만 아니라 마이크로 아키텍쳐나 회로설계, 프로세스 기술 등, 여러 면에서 전력 절약화를 꾀하고 있다.

Silverthorne의 프로세서 기술은 45nm CMOS에서[High-k재료]를 게이트 산화막으로 사용해서, 대폭으로 리크 전류를 감소시켰다. 게다가 Silverthorne에서는 모든 트랜지스터가 채널 길이가 길고 저속이지만 리크 전류가 작은 타입으로 되어 있다. PC용 CPU처럼 고속이지만 리크 전류가 많은 트랜지스터를 섞에서 사용하지는 않는다.

회로설계에서는 클럭 디스트리뷰션 네트워크를 크게 개량, 그리드레스로 하는 것으로 전력을 줄였다. L1명령캐쉬와 L1데이터 캐쉬, 그리고 C6 SRAM에 관해서는 8트랜지스터의 SRAM셀을 채용했다. 보통의 6트랜지스터 SRAM셀보다 저전압에서 고속 억세스가 가능하다고 한다. L2에서는 Intel이 Core Duo(Yonah)에서 채용한 파인그레인의 슬립 기능의 Dynamic Smart Cache Sizing을 장착했다.

FSB(Front Side Bus)는 듀얼모드에서 신호를 프로토콜로 해서, 종래의 Intel CPU의 FSB와 호환성이 있는 GTL모드 외에, 더욱 저소비전력의 CMOS모드를 지원하고 있다. CMOS모드에서는 GTL모드와 비교해 최대 1/2.5로 전력소비가 떨어진다고 한다.

마이크로 아키텍쳐 적으로는 CPU 코어를 가능한한 작게 하고, 트랜지스터 수를 낮추고 있다. CPU 코어의 트랜지스터 수는 밝혀져 있지 않지만, Core Microarchitecture(CORE MA)과 비교하면 반 정도로 보인다. 우선 전통적으로 복잡하고 전력소비가 큰 명령 디코드나 스케줄링 부분에, 다이면적 비 파워의 효율이 좋은 알고리즘을 사용하고 있다. 또한 실행 유닛 부분도 가능한한 삭감하고 있다. 예를들면 가격이 낮은 (트랜지스터 수를 먹지 않는) 정수연산에 관해서는 128-bit SIMD 연산 유닛을 탑재하고 있지만 가격이 높은 (트랜지스터 수를 먹는) 부동소수점연산에 관해서는 64-bit폭. 부동소수점연산에서는 1사이틀 당 2파이프로 128-bit 분의 SIMD연산이 된다. 또한 연산유닛으로 겸용할 수 있는 것은 가능한 한 겸용하고 있다.

게다가 잘라내는 데도 불구하고, Silverthorne의 사이즈는 많은 휴대기기용 RISC계 프로세서보다 크고 전력도 그만큼 크다. 그것이 퍼포먼스와의 트레이드 오프이다. Intel은 Silverthorne의 후계의 LPIA(Low-Power Intel Architecture)프로세서가 장래에는 스마트 폰에도 들어갈 것이라고 설명하고 있다. 그것은 스마트 폰이 필요한 프로세서 퍼포먼스가 올라가게 되면, LPIA가 커버할 범위와 겹친다는 전략이라고 추정된다.



사용자 삽입 이미지

Silverthorne의 블럭 다이어그램

사용자 삽입 이미지

Higk-k와 메탈게이트의 채용에 따른 와트 성능의 향상


 

출처 : watch.impress.co.jp