1. 들어가며 emoticon

일전에 AMD 네이티브 쿼드를 기반으로 한 ‘스파이더 플랫폼’에 대해 관심을 가진 적이 있습니다. 인텔 쿼드 플랫폼으로 가겠다는 분들에게는 인텔 쿼드에 엔비디아 650i 울트라 정도가 매력적이죠.

그런데 AMD 네이티브 쿼드 페넘의 경우 심지어 ‘9850’ 상위 기종마저 인텔 코어2쿼드 켄츠필드 Q6600 보다도 성능이 비슷하거나 다소 낮다는 평가가 많았습니다. 1x4 쿼드니, 2x2 쿼드니 기술적으로는 큰 차이가 있겠지만, 실질적으로는 큰 의미는 없어서 성능 차이로 이어지는 건 미미하겠습니다.

다만, 하위 모델은 인텔에 비해서 가격 경쟁력이 있기 때문에 ‘쿼드(코어가 4개)’에 관심을 가지는 마니아들에게 AMD 페넘 X4 시리즈 역시 선택할 여지가 충분히 있습니다. 쿼드가 유리할 작업이 있다는 전제가 성립한다는 조건에서 말이죠. 가격을 더 낮추려면 트리플 코어를 선택해도 될 터이고... 사실 멀티코어 환경을 극대화해 제대로 확인해 주는 벤치마크 툴이 없다는 점도 시끄러운 말이 계속 나오는 이유 중 하나입니다.

2. 싱글에서 쿼드가 되다 emoticon

제가 하고 싶은 얘기는 쿼드코어 끼리 경쟁은 아닙니다. 그렇게 되면 최신 플랫폼끼리 비교를 해 줘야 하는데, 인텔코리아의 경우 쿼드코어 대여 제의를 전혀 받지 못했습니다. 제품 수급이 어려운 일...

AMD 플랫폼에 관심이 있던 터라, 고민을 하다가 싱글코어인 기존 'AMD 64 베니스 3000+' 시스템에서 쿼드코어로의 업그레이드에 대한 고민을 한번 해 보았습니다. 보통 듀얼코어에서 쿼드코어로 업그레이드 하는 분들은 거의 없을 것 같습니다. 하지만 저처럼 2~3년 전에 구입한 싱글코어에 대한 고민은 많으실 겁니다. 쿼드로 바뀌면 얼마나 달라질까요.

실제로, PC 조립 시장에서 싱글코어 판매 비중은 올해 초에 이미 10% 이하로 뚝 떨어진 상태입니다.

ppt_1.jpg


3. AMD 스파이더 시스템 기본 안내 emoticon

AMD는 쿼드코어 페넘+ATI 라데온 HD3800 시리즈+AMD 7-시리즈 칩셋을 함께 구성한 시스템을 스파이더 플랫폼이라고 부릅니다.

(1) AMD 페넘 9850 쿼드코어

테스트 대상 쿼드코어 입니다. 제가 가지고 있는 비교 대상은 AMD 64 베니스 3000+ 싱글코어 모델입니다. 기존에 사용하는 중고 시스템을 그대로 가져왔습니다.

AMD Phenom X4 9850 processor TECH SPECS: (AMD 본사 자료)

- Processor Frequency: 2.5GHz
- L1 Cache Sizes: 64K of L1 instruction and 64K of L1 data cache per core (512KB total L1 per processor)
- L2 Cache Sizes: 512KB of L2 data cache per core (2MB total L2 per processor)
- L3 Cache Size: 2MB
- Memory Controller Type: Integrated 128-bit wide memory controller
- Memory Controller Speed: Up to 2.0GHz with Dual Dynamic Power Management
- Types of Memory Supported: Support for unregistered DIMMs up to PC2 8500 (DDR2-1066MHz)
- HyperTransport 3.0: One 16-bit/16-bit link @ up to 4.0GHz full duplex (2.0GHz x2)
- Total Processor Bandwidth: Up to 33.1 GB/s bandwidth
- Packaging: Socket AM2+ 940-pin organic micro pin grid array (micro-PGA)
- Fab location: AMD's Fab 36 wafer fabrication facilities in Dresden, Germany
- Process Technology: 65-nanometer DSL SOI (silicon-on-insulator) technology
- Approximate Transistor count: ~ 450 million (65nm)
- Approximate Die Size: 285 mm2 (65nm)
- Max Ambient Case Temp: 61o Celsius
- Nominal Voltage: 1.2-1.3 Volts
- Max TDP: 125 Watts

ppt_2.jpg

ppt_3.jpg

amd_4.jpg

AMD OverDrive 유틸리티 자료에서도 구체적인 사양을 확인 할 수 있습니다. 위 사양에서 알 수 있듯이, 2.5GHz에 AM2+소켓 기반이고, 하이퍼트랜스포트 3.0을 지원합니다. 3.0 규격은 이론상으로 단방향 16bit씩 2.6Ghz로 동작해 양방향으로 최대 41.6GB/s의 대역폭을 확보할 수 있습니다. 이 제품은 2.0GHz로 동작하니 대역폭 활용 폭이 크게 향상된 셈입니다. 초기에 출시된 패넘은 단방향 16bit씩 1.8Ghz로 동작해 양방향 최대 대역폭은 14.4GB/s에 불과했었죠.

이 밖에도 AMD는 쿨앤콰이어트 2.0과 AMD 밸런스 스마트 캐시 구조 등을 자랑하고 있습니다. 어찌 됐건, 9850이 기존 페넘보다 좋아진 것은 분명합니다.



ppt_7.jpg

ppt_8.jpg

ppt_9.jpg

amd_1.jpg

(2) 790FX + SB600 주기판 칩세트

HT 3.0에 AM2+를 지원하는 마더보드입니다. 이번에 사용한 메인보드 브랜드 및 모델은 M3A32-MVP Deluxe/WiFi-AP입니다. 무선랜까지 지원하고, 시스템 메모리는 DDR2 1066까지 사용할 수 있습니다. 특히 메인보드의 특징이라면 전원부, 노스 브리지, 사우스 브리지, 그리고 메모리까지 모두 히트 파이프로 연결해 발열 효과를 극대화했습니다.

[참고] 관련 제품 정보 자료
http://www.asus.com.tw/products.aspx?l1=3&l2=149&l3=591&l4=0&model=1930&modelmenu=1


ppt_4.jpg

ppt_5.jpg

ppt_6.jpg

amd_3.jpg

(3) ATI 라데온 HD 3850 그래픽카드

마지막으로 라데온 HD 3850입니다. 지난해 11월 15일 공식 출시됐죠.

다이렉트 10.1 , PCIe 2.0 (55nm) , 크로스파이어X , 파워플레이 등 이 특징입니다. 구차하게 설명을 늘어놔 봐야 어려울 것 같네요. 상위 기종인 3870의 경우 DDR4 1.2GHz 메모리를, 3850은 DDR3 900MHz를 사용합니다.

참고로 지난 3월 6일 ATI 카탈리스트 8.3이 http://ati.amd.com/support/driver.html 를 통해 공개된 바 있지요. 이걸 사용해야 제대로 벤치가 가능합니다.^^


(4) 기타 추가 주변장치

성능 극대화를 위해 PC-8000 메모리와 CPU 냉각 장치, 그리고 600W 전원공급장치도 별도로 조달했습니다.

amd_2.jpg

amd_5.jpg


4. 비교할 舊 시스템 간단 요약 (2~3년 전 실구입) emoticon

AMD 64 베니스 3000+ (1.8GHz, 939 규격)
유니텍 NF4S - 엔비디아 엔포스 4 울트라 싱글 칩  / PCIe-AGP 듀얼 모델
시스템 메모리 DDR2 PC-3200 512MB X 2
그래픽 카드는 HD3850으로 동일

[자료]비교 대상의 엔포스4 시스템 주기판 사양(현재 단종)
- http://www.unitec.co.kr/product/product_view.asp?uID={5FA39BCF-2EA8-4B24-B553-34D04812E669}&pNum=71

amd_8.jpg

amd_9.jpg


5. 테스트 진행 주요 환경 emoticon

시간이 없어서 주말 마다 시간을 조금씩 내 테스트했습니다.

그래픽 카드는 이번에 주요 테스트 대상은 아니기 때문에 HD3850을 동일하게 활용했습니다. 기타 공통 사양으로는 삼성 80GB PATA, 삼성 32배속 DVD-콤보 광 드라이브 등입니다. 첫번째 사진은 AMD Q9850 쿼드 시스템, 두번째 사진은 AMD 베니스 3000+(소켓 939) 싱글 시스템입니다. 운영체제는 윈도 비스타 얼티미트 K 평가판을 사용했습니다.

amd_6.jpg

amd_7.jpg


6. 주요 테스트 기본 자료 및 결과 emoticon

(1) Sandra - 쿼드 Q9850 시스템 기본 정보

cap0.JPG

cap0_1.JPG

cap0_2.JPG


(2) 싱글 베니스 3000+

3000_cap_0.JPG

3000_cap_0.1.JPG

3000_cap_0.2.JPG


(3)테스트 결과

pyo_1.jpg

우선, 벤치의 고전인 'Sandra' 자료입니다. 코어는 3개 더 늘었을 뿐인데, 연산 능력은 거의 6배 이상 늘었습니다. 효율이 늘어났다는 증거겠죠. 물론 단순 연산 능력이라 PC 운영체제 환경에 따른 체감 성능과는 차이가 있겠습니다.


pyo_2.jpg

역시 Sandra 자료입니다. 멀티미디어 영역 역시 마찬가지 입니다. 싱글 코어를 쓰다 멀티코어로 넘어가면 효율이 높다는 것을 알 수 있습니다.  멀티코어가 자리를 잡아 가는 건 신나는 일입니다.


pyo_3.jpg

두 테스트 환경 모두 HD3850이라는 동일한 그래픽 카드를 사용했습니다만, CPU와 보드 칩세트가 바뀌면서 성능이 2배를 넘었습니다. 그래픽 카드가 제 성능을 발휘하기 시작합니다. 당연한 소리겠지만, CPU와 GPU(VPU)는 서로 밀접하게 의존하고 있으며, 따라서 성능 밸런스 맞추기가 매우 중요하다는 점을 알 수 있습니다. 엔비디아가 최근 세계적으로 홍보하고 있는 Optimized PC 캠페인 역시 CPU만 좋거나, GPU만 좋은 PC는 기형이라는 점을 강조하고 있지요. 


pyo_4.jpg

시네벤치는 멀티코어 CPU 테스트를 할 때 렌더링이 한눈에 보여 가장 시각적인 차이가 많이 나기 때문에 자주 사용하는 벤치SW죠. 멀티코어와 싱글코어는 큰 차이를 나타냅니다.

이 뿐만 아니라 주요 동영상 렌더링 소프트웨어들에서 성능 차이가 거의 3~4배 이상 나는 엽기적인 차이르 보여줬습니다. 2~3년만에 달라진 PC 테스트 환경으로서 매우 만족스러운 수준입니다.


7. 쿼드코어가 제대로 활용이 안 되는 경우 emoticon

그런데 사실 이건 모든 사람들에게 적용되는 얘기는 아닙니다. 최근 등장하는 소프트웨어들이 대부분 멀티코어에 대한 설계를 고민한 경우가 많고, 운영체제도 윈도 비스타가 나오면서 더 효과적인 사용이 가능해졌습니다. 하지만 우리 주변에는 여전히 멀티코어보다는 클록 스피드에 좌우되는 작업도 많습니다.

<DivX社에 내장된 기본 컨버터 사용 인코딩 테스트>
- 테스트 예제 : 142MB WMV 파일을 AVI 파일로 변환

AMD 페넘 Q9850 2.5GHz             4분 02초
AMD 애슬론64 베니스 3000+      4분 20초

거의 20초 차이밖에 나지 않습니다. 딱 클록 수 차이 정도가 나는 것으로 추정됩니다.

왜 그런가 싶어 살펴보니... 실제 시스템 모니터링 정보에서 점유율 상태를 확인해 보면 이 인코딩 소프트웨어는 코어를 하나만 사용하는 것으로 확인할 수 있습니다. 따라서 코어가 1개이든 4개이든 속도 차이는 없는 것이죠.

멀티코어를 구입했을 때 성능이 기대 이하라면, 자신이 사용하는 소프트웨어가 멀티코어를 제대로 활용하는지, 활용하지 않는다면 버전업은 없는지 확인하는 게 중요합니다. 마치 '윈도 비스타 32비트'와 '64비트' 논란과 비슷한 상황이죠. 결국 실제 체감 성능은 소프트웨어 사용 환경과 습관에 달려 있습니다.

앞서 언급한 것처럼 코어가 늘어날수록 멀티스레드 기반의 다중작업 패턴을 고려해야 합니다. 이를 효율적으로 추산해 낼 벤치 툴도 많지 않습니다.

만약 위 테스트 사례에서 '인코딩'을 2개 이상 하면서 '압축파일'도 풀고,  포토샵 SW도 사용한다면 CPU 효율은 완전히 뒤집어 지겠죠. 여유가 있을 때 'PC마크'나 '오피스벤치' 등을 통해 좀 더 살펴볼 예정입니다.


7. 허접 결론emoticon

결국 특정 작업을 위해 싱글에서 쿼드로 옮겨 간다면 쿼드일 때 실질적인 효율을 따져봐야 합니다. 특히 자신이 주요 사용하는 소프트웨어나 작업 패턴이 다중작업에 최적화되어 있는지 고민하는 것이 중요합니다. 게임을 즐겨 한다면 자신이 즐기는 게임이 쿼드코어 환경에서 어떤 성능이 나올 수 있을지 사전 조사하는 게 선행돼야 합니다. 비싼 돈 투자하는데 ‘돈바른다’는 소리를 들어서는 속이 쓰리겠죠.

실제로 일반 사용자들이 사용하는 패턴 때문에 코어 수보다 클록 스피드에 더 평가 받는 경우가 많습니다. 인터넷 익스플로러 몇 개나 오피스 작업, 또는 각종 영상 파일 재생만으로 쿼드 성능을 끌어내는 건 다소 역부족이라고 봐야겠습니다.

쿼드를 사용하시나요? 그렇다면 다중 작업으로 시간 효율을 극대화하세요. A 작업을 하면서 B 작업도 동시에 해 보세요. 쿼드를 잘 쓰시는 비결입니다. 물론 이렇게 되면 작업 실행자도 다중 작업에 익숙해져야 겠지요.

저의 경우에는 주 작업이 인코딩과 동영상 편집기 렌더링인데, 시간 때문에 여러 가지 작업을 동시에 해야 할 경우가 많습니다. 코어가 많을 수록 신나는 컴퓨팅이겠지만, 지금의 만족이 쿼드에서 16코어로 늘어났을 때에도 계속 될지는 지켜봐야겠습니다.

●█▀█▄●█▀█▄●█▀█▄

Share
이 글과 가장 관련이 있는 글을 자동으로 추천해 드립니다
profile

안녕하세요. ITViewpoint 스타터이자 공동 에디터 '서명덕 기자' 입니다. 닉네임은 떡이떡이 입니다.

 

이 곳은 블로그미디어이며, 개인 공간은 http://itviewpoint.thoth.kr/ 을 메인으로 옮겨 갈 생각입니다.


개인적인 목적이라면 콘텐츠 막펌을 전면 허용 http://itviewpoint.com/blog/54971 합니다. 다만 비상업적인 용도에 한하며, 상업적인 용도라면 별도로 문의하세요. RSS http://itviewpoint.com/blog/rss 는 전문 제공합니다.