본문으로 바로가기

불도저 아키텍쳐, AMD FX 잠베지 성능

category 하드웨어/CPU 2011. 12. 13. 20:07
반응형

불도저 아키텍쳐, AMD FX 잠베지 성능

1. 불도저 아키텍쳐의 장단점?

 AMD 불도저 아키텍쳐는 다분히 '미래지향적'이다. 프로세서의 마이크로아키텍쳐는 한 번 만들어지면 적어도 몇 년을 유지되는 특성상 현재만큼이나 미래 컴퓨팅 환경의 변화를 반드시 염두에 두고 개발되어야 한다.

 그런데, 이같은 특징은 자칫 '지금'을 등한시한 결과를 초래할 수도 있는 법이다. 변화의 중간 어디쯤에선가 미래를 바라보고 구조를 디자인 한다면, 지금 현재의 흐름과는 다소 일치하지 않을 수도 있기 때문이다.

 물론, 현재와 미래를 모두 아우르는 구조를 고안해 낸다면 정답이겠지만, 하나의 아키텍쳐로 이를 모두 수용할 수 없을 수도 있다. 이어지는 테스트 결과는 새로운 아키텍쳐와 현 세대에서 가장 큰 힘을 발휘하는 아키텍쳐가 어떻게 다른 결과는 내놓을 수 있는지를 극명하게 보여주는 실례가 될지도 모를 일이다.


 

 AMD가 기존과 다른 불도저 코어를 디자인 한 이유는 의외로 간단한 데 있다. 미래의 컴퓨팅 환경은 멀티 스레딩이 주가 될 것이 분명하기 때문에 싱글 스레드에서의 성능을 다소 희생하더라도 프로세서 자체를 멀티 스레드에 최적화 하자는 것이다.

 기존 AMD의 코어도 클럭당 IPC가 다소 낮았던 것이 사실이다. 그런데 이같은 코어를 전보다 더 작은 사이즈로 줄여 둘로 나누는 방식을 사용했다? 강화된 FP를 채용하긴 했지만, 이같이 독특한 구조로 인해 프로세서의 성능을 측정하고 평가하는 기존의 방식으로는 매우 애매한 결과가 도출될지도 모를 일이다. 프로세서에 정수연산을 요하는 싱글 스레드의 작업이 입력된다면 어떻게 될까?

 불도저 아키텍쳐를 채용한 FX 잠베지 프로세서의 특징이나 변화점이 궁금한 유저들이라면 [
긴 기다림의 끝, AMD 불도저 아키텍쳐의 FX CPU 잠베지를 만나다] 기사를 먼저 읽어보도록 하자.

2. 향상됐지만, 아쉬움도 남는 성능

 앞서 살펴본 불도저 코어의 독특한 구조는 여러 작업에서 매우 다른 양상의 결과를 나타낸다. 문제는 대다수의 사용환경에서 이런 구조가 이득을 보일 것인지, 아니면 성능상의 손해로 나타나게 될 것인지 하는 부분이 아닐까?

Test Setup

CPU

  AMD FX-8150

M/B

  ASUS Crosshair V Formula

VGA

  AMD RADEON 6950 2GB

RAM

  EKMemory PC3-12800 2GB x 4

SSD

  Intel 510 Series 120GB

쿨러

  써모랩 바람

OS

  WIndows 7 UltimateK 64bit



 테스트를 위해 준비한 시스템은 위와 같다. AMD FX-8150에 사용되는 수냉 쿨러도 준비됐지만, 시장에서도 이 쿨러가 제공될지 알 수 없고, 대다수의 사용자들이 공랭 방식의 쿨러를 사용할 것이 명확한 환경에 오버클럭 등의 변수를 위해 수냉 쿨러를 사용하는 것 자체가 현실과 동떨어질 가능성이 존재해 사용자들로부터 높은 평가를 받고 있는 써모랩의 '바람 샤인'으로 대체했다. 공랭쿨러 중 최고의 성능이라 평가받기에 부족함 없는 제품이다.

 메인보드는 AMD 990FX/SB950 칩셋 기반의 ASUS Crosshair V Formula를 준비했다. ASUS의 최상위 라인업으로 ROG 시리즈 메인보드답게 현존하는 모든 기능을 대거 망라한 풀스펙 메인보드이다. 최근 아수스의 트렌드에 맞게 8+2 페이즈 전원부를 갖췄으며, CrossFireX는 물론 별도의 칩셋 등의 지원 없이 SLI를 이용할 수 있다.

 OS 설치를 위한 드라이브로는 인텔 510 시리즈 120GB SSD를 준비했다. 이만한 사양의 시스템이라면 쾌적한 컴퓨팅 환경의 구축과 빠른 게임의 로딩 등을 위해서라도 이제 SSD는 선택이 아닌 필수가 될 시점이 아닐까 생각된다.

 아주 오랜 기간, 국내외 하드웨어 마니아들에게 프로세서의 기본적인 성능을 측정하는 도구로 산드라 만큼 사랑받은 툴이 또 있을까? 최근엔 트렌드에 맞추어 다양한 모바일 계열의 벤치마크까지 추가되며 종합 벤치마크 툴로 발전하고 있다.

 FX-8150은 살펴보고 있는 불도저 코어의 잠베지 프로세서로 3.6GHz로 동작한다. 터보코어 기술로 모든 코어가 3.9GHz로 동작하거나, 일부 코어에 부하가 걸리는 경우 유휴 코어의 전력을 차단하고 동작하는 코어들만을 4.2GHz까지 속도를 끌어올리기도 한다.

 FX-8150(3.6GHz)는 앞서 설명한 터보코어의 능수능란(?)한 잔재주를 금지시킨 설정이다. 따라서 FX-8150은 최대 3.6GHz로만 동작하는 상황으로 이해할 수 있다.

 페넘II-X6 1100T는 코드명 '투반 '으로, FX 시리즈의 등장 이전 AMD의 최상위 데스크탑 프로세서였던 제품이다. 6개의 코어(헥사코어)를 갖고 있으며, 3.3GHz로 동작하다 일부 코어에 부하가 걸리면 최대 3.7GHz로 동작하는 이전 세대의 터보코어 기술이 접목돼 있다.

 인텔 Core i5-2500K는 더 설명이 필요할까? 아마 마니아들에게 최고의 인기를 끌고 있는 프로세서가 아닐까 생각된다. 쿼드코어지만, 강력한 아키텍쳐의 파워로 뛰어난 성능을 보이며, 언락된 특징으로 오버클러커들에게 절대적인 지지를 받고 있는 제품이기도 하다. 3.3GHz로 동작하지만, 역시 상황에 따라 3.7GHz까지 동작속도를 능동적으로 조정하는 인텔의 터보부스트 기술이 적용돼 있다.

 산드라 CPU Arithmetic의 결과는 FX-8150의 성능이 인텔 2500K와 엇비슷한 것을 볼 수 있다. 8개의 코어를 갖고도 쿼드코어(4개) 프로세서를 넘어서지 못하는 것이 다소 의문일 수 있겠지만, FX-8150이 가진 8개의 코어는 개선된 정수연산 유닛(IP)을 8개 채용했다기 보다, 멀티 스레드에 적합하도록 4개의 IP를 절반씩으로 쪼개놓은 형태에 가깝다. 잠베지 프로세서가 '쿼드코어의 확장형'에 가깝다는 해석 또한 이런 이유이다.

 잠베지의 구조를 살펴보면 파이프라인의 숫자가 오히려 줄어든 것을 볼 수 있는데, 이는 필연적인 IPC(클럭당 처리 명령어 수)의 하락을 불러온다. 반면, 기존의 코어 하나에 대해 잠베지는 이런 코어 두 개로 대응한다고 본다면 오히려 파이프라인이나 IPC는 다소 증가한 것으로 볼 수도 있다.

 페넘II-X6 1100T와의 결과를 살펴보면 이를 확인할 수 있다. 구조적으로 완전히 다른, 더욱 개선된 IP를 탑재한 것은 아니지만, 약간 높아진 클럭과 멀티 스레드에 최적화된 다중 코어가 작용하며 제법 의미있는 수준의 차이를 만들어내는 것을 볼 수 있다.

 AMD가 만들어낸 새로운 구조는 멀티 스레드에 대단한 능력을 보인다. 페넘II-X6 1100T와의 엄청난 차이에서 불도저가 코어를 모두 활용하는 정수연산에 있어 발군의 능력을 보인다는 사실이 확인된다. 반면, 부동소수점 연산은 기존의 FP를 그대로 채용한 느낌이랄까? 정수 연산 부분은 8개로 세분화한 코어 덕분에 엄청난 향상을 이끌어내고 있지만, 부동소수점 연산 부분은 큰 개선점을 찾아보기 힘들다. 다만, 높아진 클럭에 대비해 향상된 정도만이 확인된다.



 AMD는 불도저 코어에 새로운 메모리 컨트롤러를 도입했다. 아직 인텔의 메모리 컨트롤러와는 약간의 차이가 감지되지만, 전반적으로 큰 폭의 향상이 있었음이 확인된다. 불도저에 새로 탑재된 메모리 컨트롤러가 DDR3-1866을 지원하는 점도 빼놓을 수 없는 특징이다.


3. 명확한 특징을 보이는 '불도저'

 기본적인 벤치마크를 통해 살펴본 잠베지 프로세서는 한 마디로 '정의하기 어려운' 특징을 보인다. 전 세대 AMD 프로세서에 비해 확연히 개선된 성능을 보이지만, 오매불망 불도저를 기다려온 유저들이 과연 이정도에 만족할까 하는 의문이 드는 딱 '애매한' 성능을 보였다.

 이런 느낌으로 글을 읽어온 독자들이라면, 아래에 이어지는 테스트 결과에서는 다소 다른 느낌을 받을지도 모를 일이다.

 AMD는 잠베지를 소개하며 FP의 성능이 대폭 강화됐다고 설명했다. 하지만, 8개로 나뉜 IP와, FP를 사용하되 IP의 영향을 지대하게 받는 복합적인 작업에서 더욱 뛰어난 모습을 보였다.

 CPU를 이용한 렌더링 테스트에서 잠베지는 처음으로 가장 나은 수치를 기록했다. 부동소수점 연산 능력이 중요한 작업이지만, IP와 높은 클럭의 개입이 위와 같은 수치를 만들어낸 것으로 풀이된다.

 효율적인 구조, 높은 캐시 적중률 등은 성능에 커다란 영향을 미친다. 그런데 때로는 다수의 코어 역시 성능에 지대한 영향을 미치는 예를 목격하게 된다. 특히, 압축 알고리즘을 이용하는 경우 강력한 정수연산 능력은 매우 중요한 요소가 아닐 수 없다. FX-8150이 가진 8개의 IP는 이런 작업에서 더욱 높은 성능을 보여준다. 잠베지가 멀티 스레드에 최적화된 프로세서라는 설명은 바로 이런 작업을 통해 확인된다.

 이쯤에서 또 하나 짚어볼 점은 터보코어의 효용성이다. 다수의 코어가 오랜 시간 최고 속도로 동작해야 하는 게임 등의 환경에선 높은 코어속도를 지속적으로 유지하는 것이 부담이 될 수도 있는 일. 또한 부동소수점 연산 능력이 전체적인 성능에 지대한 영향을 미치는 작업이라면 향상 역시 미미하다.

 반면, 정수연산 능력이 요구되는 작업에서 터보코어는 매우 사용자에게 기대 이상의 유틸리티를 제공할 수도 있을 것으로 기대된다. IP를 주로 사용하는 작업 대부분에서 터보코어는 프로세서의 동작속도를 3.6GHz로 제한할 때보다 높은 성능을 보이고 있다.



 SuperPi는 기실 프로세서의 성능을 측정하는 도구로는 상당히 부족하다. 단순히 위의 결과값을 두고 잠베지 프로세서의 성능이 형편없는 것으로 평가되어서도 안 될 일이다. 아래 이미지를 보면, 파이값을 계산하는 도중 각 프로세서의 점유율을 확인할 수 있다. 이미 오래된 테스트 툴인 SuperPi는 프로세서가 제공하는 멀티 코어를 제대로 이용하지 못하기 때문이다.

 실제 SuperPi 테스트 결과는 페넘II-X6 1100T에도 미치지 못하는 결과를 보여준다. 그런데 이를 역으로 해석하면 재미있는 사실도 알게 된다. 정상적인 스레드 배분이 불가능한 것은 테스트된 모든 프로세서가 동일하다. 그렇다면 이를 통해 잠베지 프로세서가 가진 IP의 성능을 유추해 볼 수도 있지 않을까?

 결론적으로 말하자면 이렇다. 인텔 프로세서에 비해 IPC가 부족한 AMD의 프로세서의 IP가 갖는 연산능력은 페넘II-X6 1100T가 인텔의 약 70% 수준, FX-8150은 이를 다시 둘로 쪼갠 구조이기 때문에 50% 가량인 것으로 풀이할 수 있다.



 HandBreak를 이용한 동영상의 트랜스코딩에서 FX-8150은 발군의 성능을 보였다. 약 280MB 용량의 XviD 파일을 트랜스코딩 하는 데 소요된 시간을 측정한 결과이다. 엑셀의 마법(?)으로 실제보다 더 큰 차이가 벌어진 듯 보이긴 하지만, 전반적으로 다중 코어가 효과적으로 사용되는 환경을 만날 경우 잠베지는 매우 뛰어난 성능을 보이고 있다.

 하지만, 영상의 인코딩이나 트랜스코딩에는 변수가 매우 많다는 점 또한 염두에 둘 필요가 있어 보인다. 소프트웨어의 특성에 따라 프로세서를 이용하는 방식도 다르므로 이 하나의 결과만을 놓고 잠베지의 우수성이 입증됐다 하긴 부족한 감도 엿보인다. 자신의 프로세서에 최적화된 인코딩 툴을 사용하는 게 적합해 보인다. FX-8150 잠베지 프로세서에 HandBreak를 적용하는 경우 모든 코어가 100% 활용되며 빠른 성능을 발휘하는 것을 볼 수 있다.

 스마트폰, 태블릿의 급격한 보급과 함께 동영상의 트랜스코딩 필요성도 높아지고 있다. 안드로이드 계열 사용자라면 그 필요성을 느끼지 못할 수도 있지만, 아이폰 사용자라면 이는 반드시 갖추어야 할 필수 소프트웨어인 셈. 다만, 아쉽게도 국내 사용자들이 가장 많이 이용하는 다음팟 인코더는 마치 SuperPi와 같이 8개나 되는 코어를 제대로 이용하지 못했다.



 AMD는 불도저 아키텍쳐를 개발하며 명령어셋의 지원에도 공을 들였다. 인텔이 지원하고 있던 AVX(Advanced Vector Extension)과 SSE 4.1/4.2, 여기에 FMA4와 XOP 등 인텔이 지원하지 않는 명령어셋도 지원을 추가했다.

 AVX 명령어셋 내에 포함된 AES는 각종 암호화에 필요한 작업을 빠르게 수행하는 역할을 한다. 다양한 보안 소프트웨어, 암호화를 지원하는 압축 프로그램 등에 광범위하게 사용되는 만큼 이로 인한 이득 역시 큰 것이 사실이다.

 이런 명령어셋은 지원하는 프로세서와 그렇지 않은 프로세서 사이의 차이가 극명하게 드러나기 마련이다. Phenom II-X6 1100T와 FX-8150 사이에 발생하는 엄청난 차이를 보면 실감할 수 있다.

 같은 원리로 AMD FX-8150 잠베지 프로세서가 지원하는 FMA4/XOP를 활용하는 소프트웨어를 통해 비교할 경우 이를 지원하지 않는 인텔의 프로세서와는 또 극명한 차이를 보일 것이 확실하다. 다만, 암호화 작업 만큼 이런 명령어셋의 활용이 아직은 충분치 않아 실제 사용자들이 이로 인한 이득을 기대하려면 다소 시간이 필요한 느낌이다.


4. 눈 여겨 보자 '게임 성능'

 앞선 여러 테스트를 종합해 굳이 하나의 결과로 엮자면, 인텔의 Core i5 2500K와 AMD FX-8150이 엇비슷한 수준이라는 결론에 도달하게 된다. 과연 그럴까? 프로세서의 모든 부분이 사용되어야 하는 상황에서의 결과가 어떤지를 살펴보면 답이 되지 않을까?

 예상했던 결과라 해야 할까? 결국 이런 저런 특징들로 인해 프로세서의 특정 부분만을 사용하는 환경에선 우위가 마구 엇갈렸지만, 3D 게임 등과 같이 FP가 강하게 작용하고 IP가 보조하는 환경을 만나자 거의 모든 테스트 환경들이 비슷한 결과를 내놓기 시작했다.

 재미있는 부분은 해상도에 따라 승부가 갈린다는 점이다. 고해상도와 다양한 필터의 설정이 곁들여질 수록 프로세서의 영향은 줄고 GPU의 영향이 높아지므로 점수가 비슷해지는 경향을 보이는데, 그럼에도 불구하고 FX-8150은 I5 2500K를 앞서기 시작했다. 고해상도의 결과가 역전된 것은 FX-8150의 높은 클럭과 넉넉한 캐시가 긍정적 역할을 했기 때문인 것으로 예상된다.

 이전세대의 DirectX10 벤치마크 툴인 3DMark Vantage의 결과도 그러할까? 정답은 Yes! 이번에도 저해상도에서는 인텔 i5 2500K가, 고해상도에서는 FX-8150이 각각 우위를 보였다. 페넘II-X6 1100T까지 같은 경향을 따르는 것을 볼 때 불도저 코어의 우수성 때문이라기 보다는 클럭, 캐시 등의 복합적 작용의 결과가 아닐까 예상된다.



 고해상도 설정일 수록 프로세서 보다는 GPU의 영향이 크게 개입된다는 점에서 위의 결과는 프로세서간의 성능차이를 확인하기 어려울 수도 있는 것이 사실이다. 하지만, PC 기반의 엔터테인먼트 환경은 급속도로 고해상도로 이동하고 있는 것이 사실. 2560 해상도를 지원하는 모니터의 출시가 봇물을 이루고 있고, 더 넓은 화면, 더 나은 화질을 위해 대다수의 사용자들이 고해상도를 원한다는 점에서 어쩌면 더 현재의 상황을 대변하는 지표일지도 모를 일이다.

 고해상도의 게임 환경에서 프로세서간의 성능 차이는 상당히 무색해진다. 현재 주로 사용되는 1920 x 1080 해상도에 이르면 현세대의 대다수 프로세서간 성능의 차이가 모호해진다. 원래 비슷한 수준을 갖는 프로세서간의 비교이기에 그 차이가 더욱 도드라지지 않는 것일 수 있어 보인다.


 

5. 오버클럭은 '조심스럽게'

 AMD FX-8150 프로세서와의 싸움은 한마디로 시간싸움. 기사를 준비하기에 턱없이 부족한 시간이 주어졌기에 대부분의 영역에서 약간은 겉핥기 식의 테스트가 이루어질 수밖에 없던 점은 못내 아쉬운 부분이다.

 하지만, 그렇다 해도 오버클럭을 빼놓을 수는 없는 노릇! 더구나 8.429GHz의 세계신기록을 세운 프로세서가 아니던가? 자세한 테스트가 이루어지기 어려운 환경이지만, 개략적인 오버클럭 가능성 정도는 확인하고 넘어가도록 하자.

 FX-8150의 터보클럭이 동작하는 상황을 모니터링 하다보면 약 1.3V가 입력되는 상황에서 모든 코어가 3.9GHz로 동작한다는 사실을 확인할 수 있다. 그렇다면 이를 기준으로 조금씩 Ratio를 변화시켜보는 건 어떨까?

 짧은시간 동안 오버클럭의 가능성을 확인해야 하므로 FSB를 조절하는 방식은 지양하고 Ratio를 조절하는 방식을 택했다. 앞서 살펴보았듯 쿨러는 써모랩의 '바람 Shine'을 이용했으며, 120mm 팬을 장착해 1,700RPM 속도로 구동하는 환경이다.

 CPU-Z와 AMD의 오버드라이브, Prim95 등을 복합적으로 이용해 프로세서를 테스트 하였는데, 1.3V를 인가하면 실제 1.2V 가량이 입력되는 것을 확인할 수 있다. 이 환경에서 FX-8150은 3.9GHz를 가뿐히 넘어섰다.

 이후 비율을 높여가자 4.2GHz에서오류가 발생하기 시작했다. 실제 입력되는 전압 1.2V로는 다소 부족한 느낌. 이때부터 CPU와 노스브릿지의 전압을 조금씩 끌어올리 시작했다.

 프로세서에 입력되는 실제 전압이 1.34V에 이르자 4.5GHz로 동작이 가능해졌다. 얼핏 쾌재를 부를 뻔 했으나........... 자, 이제부터 위 이미지에서 이상한 점을 찾아보자. 정답을 찾은 독자라면 다음을 보자.

 Prime05 테스트가 성공적으로 진행되고 있지만, AMD 오버드라이브 부분을 확인하면 몇몇 코어의 동작속도가 4.5GHz가 아닌 1.4GHz에 멈춰있는 것을 볼 수 있다. 1.4GHz는 AMD의 전력관리기능 중 하나인 Cool'n'Quiet 기능이 동작할 때 FX-8150이 가지는 최소클럭이다. 오버클럭 시 이 기능을 Disable 시켰음에도 이같은 증상이 나타나고 있다.

 현재까지의 오버클럭은 모두 윈도우 상에서 소프트웨어를 통해 테스트하였다. 소프트웨어를 이용하면 조정하는 전압보다 실제 인가되는 전압이 0.1V 가량 낮아진다. 예컨대, 프로세서에 1.5V를 설정하면 1.4V 정도가 실제 입력되는 것으로 모니터링 된다. 또 위와 같이 몇몇 코어가 정상적으로 동작하지 않는 증상도 나타난다.

 FX 프로세서를 위한 AMD의 오버드라이브가 아직 베타버전이기 때문에 나타나는 문제일까? 하지만, ASUS의 툴을 이용해도 증상은 반복됐다. 따라서 AMD FX 프로세서를 오버클럭할 예정인 사용자라면 소프트웨어보다 아직은 BIOS를 이용하는 편을 권하고 싶다.

 BIOS를 이용하자 인가하는 전압과 실제 입력되는 전압 사이의 차이가 크게 줄어들었다. 또한 몇몇 코어가 1.4GHz로 동작속도가 떨어지는 증상도 사라졌다. 프로세서에 1.464V가 공급되는 상황에서 프로세서는 정상적으로 4.6GHz로 동작했다. 다만, 공랭 쿨러와 비교적 풍량이 낮은 팬을 사용한 탓인지 프로세서의 온도가 74도까지 상승해 이쯤에서 테스트를 중단했다.

 테스트를 위해 구성한 시스템은 Idle 시 약 88W의 전력을 소비했다. 시스템의 모든 부분 중 CPU에만 100% 부하를 가할 수는 없기 때문에 CineBench의 경우에도 여타 하드웨어들이 추가로 전력을 소모하는 것이 당연하겠지만, 이중 절대다수가 프로세서에 의해 소비될 것임은 충분히 유추할 수 있는 상황이다.

 CineBench를 이용해 부하를 가하자 시스템은 약 127W 가량을 더 소비하기 시작했다. 시스템의 전반부에 부하를 가하는 경우 RADEON 6950이 약 140W 가량의 전력을 소비하고, FX-8150 역시 125W 가량의 전력을 소비한다. 여타 메모리와 팬, SSD와 메인보드의 전력소모량을 감안하면 대략 일치한다. 32nm 공정으로 제조되므로 조금 더 낮은 TDP를 바라게 되지만, 8개의 IP를 내장한 구조를 생각하면 32nm 공정으로 이 이상을 바라기에 조금 벅찬 느낌이기도 하다.

 프로세서를 4.6GHz로 오버클럭한 상황에서는 전력소비도 급격히 늘어난다. 이때에는 378W 가량의 비교적 많은 전력을 사용하는 것을 볼 수 있다. 또 프로세서의 발열도 급격히 증가하는 양상을 보이므로 비교적 높은 수준의 오버클럭을 계획하는 유저라면 쿨링에도 신경쓰자.


6. 독특한 구조, 독특한 특징의 '불도저'

 AMD FX 프로세서 시리즈를 한마디로 정의하는 것은 매우 어려운 일이다. 이전세대의 Phenom II 프로세서에 비해 확연한 향상이 감지되지만, 그렇다 해서 오랜 AMD 마니아들이 바라마지 않는 수준의 성능을 갖고 시장에 출시됐다고 보기에도 애매한 점이 많기 때문이다.

 분명한 것은 AMD FX 시리즈 프로세서를 옥타코어(8코어) 프로세서로 생각하고 접근하는 것은 다소 위험하다는 점이다. 만일 AMD가 IP와 FP 모두 8개를 집적하는 방식을 선택했다면, 성능을 차치하고서라도 현재의 출시가는 아예 불가능했을 테니까.

 AMD는 Windows 8에서 FX 프로세서를 사용할 경우 더 많은 성능의 향상을 기대할 수 있다고 설명했다. 이는 일견 맞는 말이지만, 소위 '최적화'를 통해 드라마틱한 성능의 향상을 바라기엔 다소 무리가 있다. 현재 OS는 이미 멀티 코어와 멀티 스레드를 효과적으로 지원하고 있고, AMD가 채택한 독특한 구조 역시 현재의 OS나 소프트웨어가 사용하는 데 하등의 문제가 없기 때문이다. 결국 프로세서 내부의, 즉 AMD만의 컨트롤로 얼마든지 제어 가능한 수준의 차이일 뿐, 소프트웨어나 OS 차원에서 극적인 성능향상을 꾀할 수 있을 만큼 현재 FX 프로세서를 제대로 이용하지 못하는 경우는 거의 없다.

 OS나 소프트웨어의 최적화를 통해 약 10% 가량의 성능향상을 구현할 가능성은 분명 존재한다. 또 그동안 지원하지 않던 새로운 명령어셋을 이용해 극적인 향상을 꾀할 수도 있다. 하지만, 소프트웨어나 OS의 최적화로 그 이상의 성능향상을 이룰 가능성은 크지 않아 보인다.

 하지만, FX 시리즈를 쿼드코어의 확장형으로 바라본다면 이야기는 달라진다. 기존의 IP를 두 개로 나누고, 각각의 IP가 이전세대 제품의 70% 수준의 성능을 갖도록 코어간의 연계성과 캐시의 공유구조를 개선하고, 두 개의 128bit FP를 배치했다. 이같은 특징은 멀티 스레드를 지원하고, 이를 제대로 이용하는 소프트웨어에서 무시무시한 성능의 향상으로 나타났다. 반면, 싱글 스레드 작업에서는 다소 처참하리만치 안타까운 모습을 보이기도 했지만 말이다.

 이렇듯 FX 시리즈는 그 다른 구조 만큼이나 다양한 모습을 보였다. 그리고 이런 AMD의 결정은 전반적으로 지금보다는 향후 도래할 컴퓨팅 환경을 바라본 것이 사실이다. 불도저 아키텍쳐를 적어도 2년 이상 사용할 예정이라 한다면, AMD는 방향을 잘 잡은 느낌이다. 점차 고해상도 기반으로 진화하고 있는 컴퓨팅 환경에서 이러한 구조를 분명 큰 힘을 발휘할 것으로 기대되니까 말이다. 다만, 그럼에도 가격이 더 낮을 것으로 예상되는 경쟁사 제품에 비해 확연한 우위를 갖지 못하는 점은 다소 아쉽다.

 모든 프로세서에 배수락이 해제돼 있는 것도 긍정적인 점. 오버클럭 마니아들에게는 신나게 가지고 놀만한 장난감이 하나 더 생긴 셈이다. AMD는 내년에 불도저 코어를 더욱 개선할 계획이라 밝혔다. 여기엔 IPC의 향상, APU의 탑재 등이 포함된다. 만일 Phenom II 수준에 이르는 IP 8개가 FX 시리즈에 장착된다면? 또 한 번 기대해 볼만 하지 않을까?
 

 

국내 최대 IT/디지털 미디어 케이벤치 www.kbench.com

반응형