16코어 라이젠 9 3950X 발표! AMD ZEN 2 아키텍처

퀘이사존슈아 94 23734 53

  

 

1906___402664634.jpg

 

AMD NEXT HORIZON : GAMING TECH DAY

컴퓨텍스~E3로 이어지는 AMD의 놀라운 발표

 

 

안녕하세요. 퀘이사존 슈아입니다.

 

이제는 제법 나이가 들었다는 생각이 들면서도, 매번 새로운 게임이 공개될 때면 설레고 흥분되는 기분을 주체하기 어렵습니다. 매년 개최되는 E3 게임쇼가 아직도 기다려지는 까닭도 그 때문일까요? 올해에는 어떤 신작이 등장할까, 올해쯤 출시가 예정되었던 AAA급 게임의 발매일이 공개될까. 이런 큰 행사가 개최될 때면 기대 반 두근 반 설레는 마음과 함께 다양한 생각이 꼬리에 꼬리를 물기도 합니다.

 

고사양 게임을 원활하게 플레이하기 위해서는 응당 그에 걸맞은 시스템이 마련되어야 합니다. 물론 우수한 최적화가 적용되어 비교적 낮은 사양에서도 원활하게 동작 가능한 일부 게임도 존재는 하지만, 전반적인 하드웨어 성능이 상향 평준화를 이룩하면서 자연스럽게 이를 활용하려는 게임도 늘어났습니다.

 

오랫동안 게임계에 펼쳐졌던 인텔 천하의 영향력인지, 일부 알려진 정보처럼 매니 코어 지원을 위해서 게임 개발 난이도가 수직으로 상승하는 까닭인지 명확한 분석은 어렵지만, 그간 4코어 체계가 게임 시장을 지배적으로 이끌어온 것은 사실입니다. 하지만 게임이 표현하고자 하는 그래픽이 점차 실사에 가까워질수록, 게임에 적용되는 물리 엔진이 조금 더 현실에 가까워질수록 더 많은 하드웨어 리소스가 필요하게 되는 것은 지극히 당연한 이치겠죠. AMD가 오랜 침묵 끝에 시장에 내놓은 라이젠 프로세서를 시작으로, 이제 게임 업계는 6코어 이상 매니 코어를 원만히 지원하게끔 게임을 설계하고 있습니다. 점점 6코어 이상 프로세서의 활용도가 높아지는 만큼 오랜 기간 유지되던 게임의 패러다임이 옮겨지고 있는 분위기죠.

 

AMD가 메인스트림 시장에 투척한 8코어 프로세서는 긍정적인 방향으로 하드웨어 성능 상승을 이끌었고, 인텔도 이에 대응하듯 6코어 그리고 8코어 프로세서를 메인스트림 시장에 내놓았습니다. 바야흐로 메인스트림 시장에서도 매니 코어를 적극 활용할 수 있는 시대가 펼쳐진 것이죠.

 

그런데, AMD에서는 8코어 체계로 만족할 수 없는 모양입니다. 지난 컴퓨텍스 타이베이 2019에서 열린 AMD 콘퍼런스는 세계 최초의 메인스트림 12코어가 등장하여 연일 화제가 되었는데요. E3에서는 더욱 큰 발표가 이어졌다고 합니다. AMD 라이브 스트림을 감상하셨다면 이미 알고 계실 수도 있겠는데요.

 

네, 그렇습니다. 드디어 메인스트림 시장에 16코어가 정식으로 등장했습니다.

1906___1280846002.jpg

1906___1802375263.jpg

 

12코어 그리고 그 이상의 메인스트림 프로세서

이제 침묵은 끝났다

 

 

지난 2019년 6월 8일~9일(현지 시각), 미국 로스앤젤레스에서는 AMD 테크 데이가 한창 진행되었습니다. 퀘이사존 역시 한국 미디어로 당당히 그 이름을 올려 공식 초청을 받았죠. 현장 분위기를 담아낼 수 있도록 사진과 자료를 실시간으로 받을 수 있었는데, 엠바고가 공식 해제되는 시점이 2019년 6월 11일 오전 9시였기 때문에 바로 관련 정보를 제공해 드립니다.

 

아마 후술할 내용의 상당 부분은 이미 AMD 라이브 스트림을 통해서 접하신 내용일 것입니다. 하지만 누구나 알 수 있는 정보에서 그친다면 아쉬움이 남겠죠? 이번 칼럼에서는 AMD NEXT HORIZON GAMING TECH DAY에서 진행되었던 각종 발표 내용 중 CPU 관련 섹션을 총정리해보는 시간을 가져볼까 합니다. 현장에서 이어졌던 뜨거운 분위기를, 발표 내용을 통해 간접적으로나마 체험해보시기 바랍니다.

 

AMD 테크 데이에서는 CPU 외에 GPU 파트도 자세히 설명을 이어갔으며, 총 12명의 발표자가 자신의 섹션을 발표해 역대 최대치의 발표가 아니었나 생각이 들었습니다. CPU 파트는 크게 6개로 나뉘며, 본 칼럼에서는 GPU를 제외한 CPU 파트만 작성되었다는 점 참고 바랍니다.

 

※ 본 칼럼은 AMD 테크 데이에서 발표된 슬라이드를 바탕으로 작성되었으며, 정식 출시 제품과 일부 정보 및 성능에 차이가 발생할 수 있습니다. 일부 슬라이드 순서는 본 행사의 진행 순서와 다를 수 있으며, 이해가 편하도록 순서를 재배열했음을 밝힙니다. 본 칼럼의 주된 내용은 제품 개요쯤으로 받아들여주면 고맙겠습니다.

 

 

 

1906___436762396.png 

3세대 라이젠을 포함한 CPU 스펙 비교표 (클릭하면 큰 이미지로 감상이 가능합니다)

 

 

 

 

 

 

1906___1907129944.jpg

 

ZEN 2 + NAVI

AMD 테크 데이 오프닝 : Dr. Lisa Su

 

 

컴퓨텍스 타이베이 2019에서 이번 E3 2019로 이어지기까지, AMD는 그야말로 이슈의 정중앙에 위치하는 모습을 보여줍니다. 특히 이번 3세대 라이젠 프로세서는 7nm 제조 공정에 돌입하면서 PCIe 4.0을 적용한 최초의 메인스트림 프로세서인 까닭인지, 일반적인 경우와는 다르게 7nm 제조 공정에 RDNA 아키텍처가 새롭게 적용된 NAVI 그래픽 카드를 함께 소개하는 시간을 가졌죠. CCX 단위로 구분하던 기존 라이젠과는 달리, 이번 세대에서는 CCX 2개를 하나의 다이 개념으로 묶어서 이해하는 CCD 개념을 적극적으로 활용하고 있습니다. 일반적으로는 국내외 커뮤니티에서 많이 사용하는 칩렛(Chiplet)이 더 익숙할지도 모르겠네요.

 

AMD 테크 데이의 시작은 AMD의 CEO이자 실리콘밸리에서 가장 성공적인 데뷔를 거둔 여성으로 칭송받는 리사 수 박사가 맡았습니다.

 

 

 

 

 

1906___964393825.jpg
1906___451470907.jpg
1906___1756480214.jpg
1906___403885189.jpg
1906___1774824530.jpg
 

 

AMD가 그리는 컴퓨터의 현주소는 어디까지 도달했을까요? 거창한 목표와 겁 없는 결정은 결론적으로 우수한 가격에 강력한 제품을 만나볼 수 있는 밑거름이 되었습니다. 냉정하게 말해서 절대적인 게이밍 성능이 경쟁사의 제품보다는 소폭 떨어졌지만, 매니 코어를 적극적으로 활용하는 분야에서는 눈부신 활약을 한 셈이죠. 물론 아직 숙제는 남았습니다. 그간 약점 취급을 받던 게이밍 성능의 상승과 프로세서를 더욱더 빠르게 만드는 아키텍처의 개선, 그리고 이 모든 것을 경쟁력 있는 가격에 공급하는 일이겠죠.

 

야심 차게 발표한 3세대 라이젠은 7nm 제조 공정이 적용되었습니다. 여기에 아키텍처의 개선도 적용이 되었죠. 일반적으로 인텔이 제조 공정의 전환 뒤에 아키텍처를 개선하던 Tick-Tock 방식을 채용했던 것과 달리, AMD는 제조 공정의 큰 전환과 동시에 아키텍처의 개선까지 챙기려는 모습을 보여줍니다. 두 마리의 토끼를 동시에 잡는 것은 소비자 입장에서 매우 환영할 만한 이야기지만, 어느 쪽도 완성도 높은 모습을 보이지 못하게 된다면 실패한 시도가 될 수밖에 없죠. 그런 점에서, ZEN 아키텍처가 도입된 이후 AMD의 결정은 매우 공격적이고 과감합니다. 그 결과는 우리가 익히 아는 바와 같이 1세대 라이젠 그리고 2세대 라이젠 프로세서로 이어졌습니다.

 

 

 

 

 

1906___616306587.jpg
1906___399006209.jpg
1906___1278714075.jpg
1906___1651992660.jpg
1906___1103699593.jpg
1906___1716602520.jpg
1906___997593266.jpg
 

  

3세대 라이젠 프로세서를 발표하면서 AMD가 최우선으로 삼은 목표는 단연 '게임'입니다. 업계에서 유일하게 커스텀 APU를 함께 판매하는 기업답게 PC 시장부터 콘솔, 앞으로 보급이 예상되는 클라우드 게이밍 시장까지도 AMD 제품을 보는 것은 어렵지 않게 되었죠. 차세대 플레이스테이션(PlayStation)과 스타디아(Stadia)에도 AMD 플랫폼이 탑재될 예정이기에, 이런 흐름은 앞으로도 장기화할 것 같네요. 게임을 즐기는 유저의 입장에서, 콘솔이나 각종 클라우드 게이밍 시장에 AMD 제품이 투입된다는 것은 고무적인 일입니다. 동일한 아키텍처로 구성된 프로세서에서도 충분히 득을 볼 가능성이 커지기 때문이죠. AMD 프로세서나 그래픽 카드를 활용하는 유저에게도 이러한 혜택이 돌아갈 가능성은 농후합니다.

 

 

 

 

 

1906___1014172446.jpg
1906___1198617713.jpg
1906___669155221.jpg
 

 

이제 본격적인 슬라이드가 시작됩니다. 이미 컴퓨텍스 타이베이 2019를 통해 익히 알려진 내용이지만, ZEN 2 아키텍처가 적용되는 3세대 라이젠은 몇 가지 특징을 지니고 있습니다. 대표적인 세 가지의 특징은 IPC 15% 향상, 캐시 사이즈 2배 향상, 부동소수점 성능 2배 향상이죠. 각 내용과 관련된 세부 파트는 아래에서 다시금 소개됩니다.

 

 

 

 

 

1906___756929990.jpg
1906___177434565.jpg
1906___1839381288.jpg
1906___1633954668.jpg
1906___660096466.jpg
 

 

※ 프로세서의 전반적인 소개와 성능을 확인하기에 앞서 한 가지 짚고 넘어가야 할 부분이 있습니다. 바로 테스트에 쓰인 시스템 사양이 명확히 언급되지 않았다는 점입니다. 만약 본 테스트 결과가 지포스 RTX 2080이나 라데온(Radeon) VII과 같은 그래픽 카드에서 진행되었다면, 지포스 RTX 2080 Ti와 같은 플래그십 모델에서는 결과의 양상이 달라질 수 있습니다. 이 점은 필히 유념하여 자료를 확인해야 합니다.

 

 

먼저 라이젠 9 3000 시리즈 및 라이젠 7 3000 시리즈입니다. 8코어와 12코어로 구성된 하이엔드 라인업으로, 더욱 강력해진 성능과 낮아진 전력량이 대표적인 특성이라고 할 수 있습니다. 특히 라이젠 9 3900X의 경우는 메인스트림 데스크톱 프로세서 최초로 12개의 코어가 탑재되었는데요. 6코어로 구성된 2개의 칩렛이 하나의 PCB 위에 집적되어 MCM(Multi Chip Module)이라고 해석하기도 합니다. 조금 더 원론적으로 얘기해보자면, 사실 CCD(Compute Core Design) 역시 2개의 CCX로 구성되어 있기에 고전적인 개념에서는 MCM으로 보아야 맞겠지만, 각 다이가 독립적으로 동작하지 않고 하나의 로직으로 처리되기 때문에 MCM과는 개념적인 차이를 보입니다.

 

어쨌든, AMD의 발표 내용에 따르면 라이젠 9 3900X는 인텔 코어 i9-9900K와 게이밍 성능에서 비등한 모습을 보여준다고 합니다. 특히 저해상도(720p/1080p)에서 약한 모습을 보이던 1/2세대 라이젠 프로세서와 달리, 라이젠 9 3900X는 1080p 게이밍 성능을 당당히 그래프 화하여 첨부했습니다. 인텔 코어 i9-9900K와 비교하더라도 큰 폭으로 차이가 벌어지는 것 같지는 않은데, 게임의 다수가 그래픽 카드 이상으로 프로세서의 영향력이 큰 멀티플레이 게임으로 구성된 점이 인상적이네요.

 

또한, 라이젠 9 3900X는 12개의 물리적인 코어를 지니고 있는 만큼 스트리밍 환경을 구성하기도 더욱 좋아졌습니다. 디비전 2의 1440p 평균 프레임 레이트에서는 방송 활성화 유무와 관계없이 최대 90 FPS 수준을 유지했으며, 경쟁사의 8코어 16스레드 제품과 비교하더라도 매우 높은 화질을 60 FPS에 가까운 수치로 꾸준히 제공하는 것이 가능했다고 합니다. 3.8 GHz의 기본 클록과 4.6 GHz의 부스트 클록을 지닌 12코어 프로세서라니, 실제 테스트 성능 역시 상당히 기대됩니다.

 

라이젠 9 3900X가 최고의 게이밍 경험을 위해 준비된 $499 프로세서라면, 라이젠 7 3800X는 이보다 $100 저렴한 $399에서 킬러 타이틀의 자리를 노립니다. 콜 오브 듀티: 블랙 옵스 3나 데빌 메이 크라이 5, 문명 6(CPU), 배틀그라운드, 로켓 리그에서는 라이젠 9 3900X과 동일한 성능을 보여주는 것을 알 수 있는데, 이는 각 게임이 8코어 이상 물리적인 코어를 온전하게 활용하지 못해 발생하는 문제로 보입니다. HPC(High Performance Computing) 분야에서 잉여 자원이 발생하는 것은 좋지 못한 일이겠지만, 나열된 게임이 인텔 코어 i9-9900K 및 코어 i7-9700K에서도 비슷한 성능을 보였다는 점을 고려한다면 비단 AMD 프로세서만의 문제는 아닐 것입니다.

 

라이젠 7 3800X는 3.9 GHz의 기본 클록과 4.5 GHz의 부스트 클록을 지니며, 라이젠 7 3700X는 기본 클록이 0.3 GHz 낮은 대신 65w TDP(열 설계전력)에 맞추어져 있습니다. 라이젠 프로세서는 전통적으로 오버클록을 적용해 상위 제품군과 비등한 성능을 발휘하는 모습을 보여주었기에, 오버클록 잠재력이 엄격하게 제한되지 않았다면 라이젠 7 3700X가 상당한 가성비를 보여줄 것으로 기대됩니다.

 

 

 

 

 

1906___1746114264.jpg
1906___683648425.jpg
1906___2055755651.jpg
 

 

이어지는 발표 내용은 이번 AMD 테크 데이의 별미이자 12코어를 넘어서는 괴물, 라이젠 9 3950X의 등장이었습니다. 8코어로 구성된 CCD 2개를 탑재해 16개의 물리적인 코어를 지니는 제품으로, 기존 라이젠 스레드리퍼 1950X/2950X의 네이밍을 이어받아 3950X로 명명되었다고 생각됩니다. 코어 수가 늘었음에도 부스트 클록은 오히려 4.7 GHz로 높아진 점이 인상적인데요. 실질적인 성능을 대변할 올 코어 부스트 클록이 어느 정도를 유지할지가 관건이 되겠습니다. 캐시 메모리는 무려 72 MB로, 1세대 및 2세대 라이젠 스레드리퍼 프로세서조차 가지지 못했던 무시무시한 용량입니다. 다만, 라이젠 9 3950X를 직접 만져볼 수 있는 시기는 7월 7일이 아닙니다. 명확한 날짜를 언급하는 대신 2019년 9월로 표기해두었을 뿐이죠. 가격에 대해서는 아직 공개되지 않은 상태인데, E3 라이브 스트림에서 정식 발표가 될는지도 모르겠습니다.

 

리사 수 박사의 오프닝 발표에서는 라이젠 5 3000 시리즈에 대해 구체적인 언급을 하지는 않았지만, 1세대 및 2세대 라이젠 프로세서에서 6코어 12스레드 라인업이 상당히 주목받았던 만큼 이번 세대에서도 어느 정도 효율을 보여줄 것인지 기대가 됩니다.

 

 

 

 

 

 

 

 

 

 

1906___698429022.jpg

1906___452415547.jpg

 

3세대 라이젠 프로세서 개요

15% 향상된 IPC 그리고 구조적 변경 : David McAfee

 

 

리사 수 박사의 발표 내용이 CPU 및 GPU의 거시적 관점에서 다루어졌다면, David McAfee의 발표는 3세대 라이젠에 조금 더 깊숙하게 파고드는 발표 내용입니다. 물론 후술할 CPU 아키텍처 부문에서는 더욱 하위레벨(Low-Level)로 들어가는 내용이 나오지만, 단순히 프로세서를 소개하는 개요 측면에서는 David McAfee의 발표 내용을 주목할 필요가 있겠네요.

 

 

 

 

 

1906___1129704749.jpg
1906___603105397.jpg
1906___860852385.jpg
1906___1503745203.jpg
1906___1935770988.jpg
1906___945523446.jpg

 

 

하드웨어에 대한 관심사는 언제나 '성능'으로 이어집니다. 지금까지 그래왔고, 앞으로도 그럴 테죠. 뛰어난 성능의 하드웨어는 사용자에게 조금 더 나은 경험을 제공하기 마련입니다. 게임의 경우 조금 더 부드러운 프레임 레이트를 유지해 쾌적하게 즐길 수 있고, 작업에서는 효율을 올려 최종 시간을 줄이는 데 기여할 수도 있죠. 절대적인 성능을 요구하는 하드웨어 시장에서는 냉혹하리만치 절대적인 결과물이 평가받을 수밖에 없는 이유이기도 합니다.

 

3세대 라이젠 프로세서는 전반적으로 인텔 9세대 코어 프로세서를 겨냥하도록 정의되었습니다. 아직 공개되지 않은 라이젠 9 3950X를 제외하고 논하자면, 라이젠 9 3900X는 인텔 코어 i9-9900K와 동일한 MSRP인 $499로, 라이젠 7 3800X 및 라이젠 7 3700X는 인텔 코어 i7-9700K와 비슷한 수준의 가격선인 $300대를 유지합니다. 가장 현실적인 메인스트림 게이밍 라인업, 라이젠 5 3600X와 라이젠 5 3600은 $200 언저리를 유지하도록 구상해, 경쟁사의 코어 i5 9000 시리즈보다 조금 더 나은 가격 경쟁력을 지니죠.

 

시네벤치(Cinebench) R20 싱글 스레드를 기준으로, 라이젠 7 2700X의 대체재라 할 수 있는 라이젠 7 3700X는 15%가량 성능이 향상되었다고 합니다. 이보다 부스트 클록이 더 높게 책정된 라이젠 7 3800X와 라이젠 9 3900X는 조금 더 높은 성능에 도달했는데요. 해당 슬라이드는 IPC의 향상 수준을 보여주는 것이 아님을 참고해야 합니다. 아키텍처의 근본적인 구조가 변경된 것이 아닌 이상, 코어 클록이 증가한 만큼 성능이 향상되는 것은 당연한 이치니까요.

 

그 아래로 이어지는 슬라이드는 조금 이색적입니다. 3세대 라이젠 프로세서는 CCD를 2개까지 장착할 수 있기에 최대 4개의 CCX와 I/O 다이로 구성됩니다. 기존 Windows 10에서는 현재 요구하는 작업량이나 온도에 따라 적정 코어 클록을 선택하는 과정에서 30ms 수준의 딜레이가 발생했다고 하는데요. 5월에 이루어진 Windows 10 19H1 업데이트를 적용할 경우 코어 클록 지정까지 1-2ms 수준의 딜레이로 좁혀진다고 합니다. 현 상태에서 최적의 코어 클록을 적용할 수 있다는 것은 조금이나마 더 나은 성능을 적용하는 것이 가능하다는 이야기겠죠. 이런 부분이 실성능에 어떻게 반영될 것인지는 테스트를 진행해봐야 알 수 있겠지만, 단순히 IPC를 늘리고 코어 수를 늘리며 코어 클록을 올리는 데 그치지 않는 것은 중요한 부분입니다. 궁극적으로 이를 활용하는 운영체제에서 최대 성능을 발휘할 수 없다면, 하드웨어의 발전을 온전하게 만끽하기 어려울 테니까요.

 

또 하나 이미지는 CCX의 활용도인데요. 하나의 아무리 CCX 및 CCD가 가깝게 놓여 있고 인피니티 패브릭으로 묶여있다고 해도, 물리적으로 나뉘어 있는 만큼 다른 CCX의 코어를 병행 활용하게 되면 레이턴시가 발생할 수밖에 없을 것입니다. Windows 10 19H1 업데이트에서는 하나의 CCX 내에 있는 자원을 최대한 활용할 수 있도록 스케줄링을 조절했다고 하는데요. 이는 3세대 라이젠 프로세서뿐만 아니라 이전에 출시된 모든 라이젠 프로세서에 적용되는 부분이라고 합니다.

 

결론적으로 이런 스케줄러 최적화 작업은 성능 향상으로 이어진다는 것이 AMD의 설명입니다. 로켓 리그(Rocket League) 1080p Low 프리셋 테스트와 PCMark 10의 웹브라우징 서브 테스트(Web Browsing Sub-Test)에서 각각 15% 및 6%의 성능 향상을 가져온다고 합니다.

 

 

 

 

 

1906___1272715998.jpg
 

 

마지막으로 언급되는 대주제는 메모리 레이턴시입니다. 1세대 및 2세대 라이젠 프로세서가 결정적으로 취약했던 부분은 메모리 레이턴시가 상당히 늘어진다는 부분이었습니다. 실제로 2세대 라이젠 프로세서인 피나클 릿지의 경우 1세대 라이젠 프로세서와 동일 수준의 코어 클록을 맞추더라도 게이밍 성능이 조금 더 나은 것을 확인할 수 있는데, 캐시 메모리를 비롯해 메모리 레이턴시에서 최적화 작업을 적용한 부수적인 결과 중 하나입니다.

 

3세대 라이젠 프로세서에서는 I/O 다이가 코어 다이 바깥으로 독립되었기 때문에 커뮤니티 내외에서 많은 네티즌이 메모리 레이턴시를 걱정하는 분위기였습니다. 오히려 게이밍 성능이 깎이는 것이 아니냐는 의심도 샀었죠. AMD에서는 메모리 레이턴시 문제를 해결하기 위해 캐시 메모리를 2배로 늘리는 특단의 조치를 취했습니다.

 

L3 캐시 메모리의 용량이 1세대 및 2세대 라이젠 프로세서보다 2배로 늘어나면서 최종적인 게임이 성능 향상에도 크게 기여했다는 것이 AMD 측의 분석인데요. 회색 바는 L3 캐시 메모리를 16MB로 제한한 상태이고, 주황색은 L3 캐시 메모리를 32MB로 늘려둔 상태입니다. DDR4-2,667 MHz에서 DDR4-3,600 MHz로 동일하게 오버클록을 적용하더라도 L3 캐시 메모리가 늘어난 쪽이 월등한 성능 향상을 이루었다는 것을 알 수 있죠. 물론 이 슬라이드의 성능은 절대적인 게이밍 성능을 대변하는 것은 아니기에 다른 대조군과의 비교가 필요하지만, AMD가 '게임캐시(GAMECACHE)'라는 공격적인 마케팅 용어를 붙인 것이 만용처럼 비추어지지는 않습니다.

 

게임캐시의 적용으로 메모리 레이턴시를 최대 33ns 수준까지 효율적으로 개선할 수 있으며, 이로 인해 게이밍 성능은 1080p High 프리셋 수준을 기준으로 최대 21% 수준까지 향상되었다고 합니다.

 

 

 

 

 

1906___157641454.jpg
1906___874854424.jpg
1906___409008518.jpg
1906___325803741.jpg
1906___511120127.jpg
 

 

이제부터 이어지는 슬라이드는 프로세서별 성능 향상 표입니다. 앞서 서술한 내용처럼 라이젠 9 3900X는 인텔 코어 i9-9900K를 겨냥해 6종 게임에서 대등한 수준의 게이밍 성능을 보이고, 벤치마크 툴 및 인코딩/렌더링 소프트웨어에서는 늘어난 코어 수만큼 더 나은 작업 효율을 가져다줍니다. 그러면서도 인텔 코어 i9-9900K보다 소비 전력은 감소했다고 하는데요. 와트당 성능으로 환산해보자면 약 58%의 작업 효율 향상을 기대해볼 수 있다고 합니다.

 

여기에 빼놓을 수 없는 한 가지, 바로 PCIe 4.0이 적용된 최초의 플랫폼이라는 점도 간과할 수는 없겠죠. 현시점에서는 유일하게 PCIe 4.0으로 동작하는 그래픽 카드, NAVI 그래픽 카드와 어떤 시너지 효과를 낼 수 있는지는 저 역시도 궁금한 부분입니다.

 

 

 

 

 

1906___892473213.jpg
1906___208022313.jpg
1906___20870977.jpg
1906___441513063.jpg
1906___891460567.jpg
1906___1872139143.jpg
1906___1546193232.jpg
 

 

다음으로 이어진 프로세서 소개는 라이젠 7 3800X입니다. L2 캐시 4MB와 L3 캐시 32MB가 결합하여 36MB의 게임캐시를 지닌다고 소개하고 있는데요. 라이젠 9 3900X와 마찬가지로 인텔 코어 i7-9700K를 직접 겨냥해서 성능 및 효율 비교를 진행했습니다. 8종 게임 비교에서는 비슷하거나 소폭 떨어지는 게이밍 성능을 보이는 것으로 추측되지만, 작업 성능에서는 SMT 구조에 강한 AMD의 장점이 충분히 드러나는 것 같습니다.

 

일부 게임 타이틀을 제외한다면, PBO(Precision Boost Overdrive)와 같은 기술이 접목되었을 때 좋은 경쟁 구도가 펼쳐질 것으로 기대해볼 수 있겠네요. 하지만 방심은 금물! 퀘이사존에서 직접 테스트를 진행한 칼럼을 본 뒤에 결론을 내리셔도 늦지 않을 것이라 생각합니다.

 

라이젠 7 3800X 소개에서는 독특하게도 발열을 함께 언급했는데요. 인텔 코어 i7-9700K와 동일한 타워형 쿨러를 설치했을 때, 라이젠 7 3700X가 조금 더 낮은 온도를 유지한다고 설명하고 있습니다. 해당 부분 역시 테스트로 검증이 필요한 대목이겠죠.

 

 

 

 

 

1906___172710054.jpg
1906___1167002150.jpg
1906___1796270232.jpg
1906___1682640709.jpg
1906___377980221.jpg
 

 

라이젠 7 3700X는 코어 클록을 제외한 부분이 동일하기 때문에 건너뛰고, 이번에는 라이젠 5 3600X입니다. 사실 금전적인 부담이 그나마 적으면서 게이밍 시스템을 꾸릴 수 있는 마지노선이라고 할 수 있는 라인업이 바로 라이젠 5/코어 i5 라인업이라고 생각합니다. 실제로 해당 라인업은 제조사를 막론하고 높은 판매고를 올렸죠.

 

라이젠 7 3700X는 6코어 12스레드로 구성되며, 3.8 GHz의 높은 기본 클록을 지닌 것이 특징입니다. 이 때문에 TDP는 105W로 표기되어 있는데, 별도의 오버클록이 적용되지 않더라도 괜찮은 성능을 기대해볼 수 있겠네요. 이번에는 인텔 코어 i5-9600K와 직접 비교를 진행했는데, 게임 성능은 평균적으로 비등한 수준을 보여주었습니다. 1세대 및 2세대 라이젠 프로세서가 8세대 인텔 코어 프로세서와 비교해서도 상대적으로 게이밍 성능이 떨어졌다는 것을 고려한다면, 라이젠 5 라인업까지도 동일 라인업에서 대등한 성능을 보이는 것이 제법 흥미롭습니다.

 

여기에 SMT가 적용되어 논리 스레드는 2배로 동작하기에, 상대적으로 작업 성능 효율은 코어 i5-9600K보다 높은 모습을 보여주는데요. 나쁘지 않은 게이밍 성능, 동급 인텔 프로세서 대비 더 높은 작업 성능을 지니기에 제법 많은 유저가 찾게 되는 프로세서가 되지 않을까 생각합니다.

 

 

 

 

 

1906___1629111849.jpg
1906___1275269247.jpg
1906___95076317.jpg
1906___1917472280.jpg
1906___1388140435.jpg
1906___1631711192.jpg
  

 

마지막으로 언급되는 내용은 AM4 및 X570 플랫폼의 구성, 그리고 더욱 간편해진 BIOS 오버클록 메뉴와 PBO에 대한 짧은 언급입니다. 어느덧 라이젠 프로세서를 지원하는 AM4 마더보드도 500 시리즈에 접어들었는데요. 1세대 라이젠부터 3세대 라이젠까지는 이론적으로 300 시리즈 이후 마더보드에서 모두 활용이 가능합니다. 다만 지난 컴퓨텍스 타이베이 2019에서 공개된 내용에 따르면 A320 마더보드는 3세대 라이젠 프로세서를 지원하지 못하며, X370 및 B350 마더보드는 제조사의 바이오스 업데이트 재량에 맡긴다고 합니다. PCIe 4.0의 지원 여부 역시 공식적으로는 없을 것이라고 못 박은 만큼, 제조사가 얼마나 재량을 발휘해줄 것인지가 크게 작용할 것 같네요.

 

300 시리즈 마더보드와는 대조적으로, 400 시리즈 마더보드를 활용하는 유저는 바이오스 업데이트만으로 간단히 3세대 라이젠 프로세서를 사용할 수 있습니다. 물론 X370/B350 마더보드도 제조사에 따라서는 이미 ComboPI가 적용된 베타 바이오스가 업로드되고 있기에, 큰 이변이 없는 이상 대다수의 제조사가 3세대 라이젠 프로세서를 지원하는 방향으로 가지 않을까 짐작해볼 수 있습니다.

(※ 이 과정에서 브리스톨 릿지나 애슬론 프로세서 일부가 미지원될 가능성이 있으니, 업데이트를 속행하기 전에 반드시 베타 바이오스의 참고 내용을 확인해볼 필요가 있습니다.)

 

제조사의 재량에 맡긴다는 이야기는 AMD에서 직접적인 케어를 포기한다는 의미로도 들리기 때문에, 향후 5년가량 문제없이 활용할 수 있을 것으로 기대했던 사용자에게는 일말의 실망감을 안겨줄 수도 있겠다는 생각이 듭니다. 하지만 코어 수가 최대 16개로 늘어나고 PCIe 4.0이 적용되는 커다란 변화가 존재하는 만큼 일방적인 비난을 할 수는 없는 노릇이겠죠. 다시 한번 언급하지만 메이저 제조사는 300 시리즈의 ComboPI 베타 바이오스를 이미 출시한 상태이기에, 큰 이변이 없는 한은 3세대 라이젠 프로세서를 활용하는 데 큰 무리가 없을 것으로 예상됩니다.

 

프로세서 문제는 해결이 되었다고는 하지만, 메모리 문제는 어떨까요? AMD에서 소개하는 X570 마더보드는 USB 3.2 Gen 2 포트를 비롯해 더욱 유연해진 확장성을 보인다는 내용도 포함되어 있지만, 공랭 상태에서 DDR4-5,100 MHz 도달에 성공했다는 기록도 함께 공개했습니다. 다만 IF(Infinity Fabric) 클록으로 유추해볼 수 있는 NB Frequency는 1,283 MHz로 메모리 주파수의 절반(2,566 MHz / 2)에 해당하는 것으로 보입니다. 이미 DRAM Calculator for Ryzen 소프트웨어 제작자로 유명한 1usmus는 메모리 클록이 일정 수준 이상에 도달하면 IF 클록이 절반의 수치로 동기화가 이루어질 것이라는 언급을 한 바가 있는데요. IF 클록이 절반 수준으로 떨어지는 상황에서는 메모리 클록의 향상이 성능 향상으로 고스란히 이어질 것인지도 궁금해집니다. 이러한 부분 역시 테스트를 통한 검증이 필요한 부분이겠죠.

 

마지막에 첨부된 슬라이드에 대해서는 하단에서 다시금 다룰 텐데, 기존의 PBO 대신 PBO 오토매틱 오버클러킹을 적용했을 때의 수치로 판단됩니다.

 

 

 

 

 

 

 

 

 

 

1906___1936423704.jpg

 

라이젠 3000 시리즈 APU 소개

차세대 APU의 귀환 : Travis Kirch & Don Woligroski

 

 

1세대 라이젠 프로세서의 등장과 함께 많은 이들의 주목을 받았던 것은 다름 아닌 APU입니다. 많은 유저는 프로세서와 그래픽 카드가 독립적으로 장착된 시스템을 활용하지만, 그보다 더 많은 사용자는 여전히 단일 프로세서로 구성된 시스템을 활용하고 있습니다. PC가 가장 많이 보급되는 회사를 예로 들자면, 대부분은 프로세서에 탑재된 내장 그래픽을 적극적으로 활용하여 시스템 단가를 획기적으로 낮추기를 원하는 경우가 많죠.

 

이전 세대와 마찬가지로, 라이젠 3000 시리즈에 투입되는 APU 라인업은 ZEN 2 기반이 아니라 ZEN + 기반으로 구성되는 APU입니다. 하지만 라이젠 2000 시리즈 APU가 그러하듯, 이전 세대 아키텍처를 고스란히 적용하기보다는 최적화 작업을 거쳐 조금 더 나은 프로세서로 공급한다고 예상을 해봐야겠죠. 특히 필자는 개인적으로 그래픽 코어 클록의 수치 향상에 주목했습니다. 100~200 MHz 수준이 큰 차이라고 생각되지 않을 수도 있겠지만, 내장 그래픽에서는 충분히 훌륭한 성능을 발휘하던 라이젠 5 2400G/라이젠 3 2200G를 고려해보면 무시하기 어려운 수치 상승이기 때문이죠.

 

 

 

 

 

1906___1185243770.jpg
1906___165161317.jpg
1906___932125286.jpg
 

 

라이젠 5 3400G에는 상위 라인업에 포함되던 AMD 레이스 스파이어(Wraith Spire)가 탑재되어 더욱 강력한 쿨링 성능을 기대해볼 수 있게 되었습니다. 이전 2400G/2200G와 마찬가지로 실리콘 접합 방식이 적용된 듯한데, 라이젠 5 3400G에는 Metal TIM(Thermal Interface Material)이 사용되었다고 합니다. 얼핏 떠오르는 것은 리퀴드 프로와 같은 액체 서멀 컴파운드인데요. 솔더(Solder)라는 용어 대신 Metal TIM이라고 표기한 것을 보면 솔더링과는 다른 것 같기도 합니다. 어쨌든 더 나아진 번들 쿨링팬, 그리고 열전달 소재의 변경, 여기에 PBO 오토매틱 오버클러킹(Automatic Overclocking) 기능이 새롭게 추가되었다고 하니 얼마나 강력한 성능 시너지를 발휘할 수 있을까 기대됩니다.

 

 

 

 

 

1906___41669527.jpg
1906___173890529.jpg
1906___354816297.jpg
 

 

강력한 내장 그래픽 성능을 보유한 만큼, 라이젠 3000 시리즈 APU는 적정 수준의 게이밍 환경에서도, 4K 동영상 재생과 같은 엔터테인먼트 환경에서도 폭넓게 활용하는 것이 가능하겠습니다. 특히 베가 그래픽스가 탑재되어 있기에 프리싱크(FreeSync) 1&2 기술을 활용하는 것도 가능한데, Amazon Instant Video를 비롯해 NETFLIX, FunBox UHD 등 다양한 4K HDR 스트리밍 서비스를 활용하는 것이 가능합니다.

 

여기에 RADEON ANTI-LAG 기술이 적용되어 높은 FPS로 플레이하는 것과 비슷한 수준의 응답 시간을 달성하는 것이 가능하다고 합니다. 위에서 언급한 몇 가지 기술적인 부분과 마찬가지로 테스트를 통한 검증이 필요한 대목이겠지만, 내장 그래픽을 넘어서는 성능을 발휘하기 위해 다양한 시도가 곁들여졌다는 것을 알 수 있습니다.

 

 

 

 

 

1906___1526013480.jpg
1906___1948348204.jpg
1906___1322545414.jpg
 

 

비슷한 가격대에 있는 인텔 코어 i5-9400의 내장 그래픽과의 비교 그래프입니다. 생산성 측면에서는 최소 142% 이상 성능 차가 발생하며, 1080p 해상도에서 진행된 9종 게임 테스트에서는 라이젠 5 3400G가 평균적으로 30 FPS 수준을 유지하면서 게임 플레이가 가능한 마지노선 영역을 유지하는 모습을 보여주었습니다. 어떤 옵션에서 테스트가 진행된 것인지는 표기되지 않았지만, Low 프리셋을 기준으로 하더라도 나쁘지 않은 성능입니다.

 

다음은 라이젠 3000 시리즈 APU가 포함된 가격표입니다. 특이하게도 인텔 프로세서는 최소 RCP(Recommended Customer Price, 추천 소비자가) 중 낮은 쪽의 가격이 기재되어 있는데, 그런데도 라이젠 7 3700X나 라이젠 5 3600X, 라이젠 5 3400G와 같은 제품이 비교적 경쟁력 있는 가격임을 보여주고 있습니다. 절대적인 성능 평가에 따라 적정가인지 판단이 서겠지만, 코어 수와 가격을 고려해본다면 이전 세대 라이젠 프로세서와 마찬가지로 여전히 높은 경쟁력을 유지할 것으로 기대됩니다.

 

 

 

 

 

1906___370189457.jpg
1906___1808025762.jpg
 

 

해당 발표 섹션에서는 3세대 라이젠 프로세서에 대한 요약 내용과 X570 마더보드 관련 내용도 언급되었습니다. 인상적인 부분은 역시 라이젠 9 3900X가 아닐까 하는데요. 싱글 스레드뿐만 아니라 멀티 스레드까지도 인텔 HEDT 라인업에 속해 있는 코어 i9-9920X를 압도하는 모습을 보여줍니다. 1세대 라이젠 프로세서가 인텔 코어 i7-6900K와 직접적인 성능 비교를 하던 것이 오버랩되는 기분이네요.

 

'킬러 특성'이라고 표기된 3세대 라이젠 프로세서의 특징도 언급되어 있었는데요. X570 마더보드는 역대 라이젠 시리즈와 비교했을 때 가장 다양한 라인업이 구성되며, 여전히 AM4 플랫폼을 유지하기에 마더보드를 재활용할 수 있다는 여지도 남아 있습니다. X570 마더보드에 탑재되는 PCIe 4.0 레인을 활용한 엄청난 대역폭의 저장 장치도 활용할 수 있습니다. 강력하면서 간단한 메모리 오버클러킹 그리고 PBO 오토매틱 오버클러킹 기능도 언급이 되어 있는데요. 아래 슬라이드에서 조금 더 자세히 살펴보도록 하죠.

 

 

 

 

 

1906___1364679585.jpg
1906___1186478196.jpg
1906___1981159857.jpg
1906___1734605709.jpg
1906___1437606600.jpg
 

 

먼저 AM4 + X570 플랫폼의 확장성입니다. 3세대 라이젠 프로세서의 확장성과 X570 마더보드의 확장성을 더하면 USB 3.2 Gen 2 포트를 최대 12개, USB 2.0 포트를 최대 4개, SATA 6Gb/s 포트를 최대 14개까지 탑재하는 것이 가능해졌습니다. 여기에 PCIe 4.0 레인을 36개(= '3세대 라이젠 프로세서 24개' + 'X570 마더보드 최대 16개' - 'CPU-PCH 4개 사용')까지 활용할 수 있기에 다양한 장치에 배분하는 것이 가능해졌죠. X570 칩세트를 독립적으로 떼어놓고 보더라도, 인텔 Z390 칩세트보다 조금 더 나은 확장성을 보입니다. 3세대 라이젠 프로세서에 도달해서는 입출력 단을 획기적으로 늘렸다는 것을 알 수 있는 대목이죠. PCIe 4.0이 적용되었다는 것을 제외하더라도 레인 수가 상당히 여유로워졌음을 알 수 있습니다.

 

메모리와 관련된 부분도 짤막하게 언급이 되었습니다. 성능상 최적의 스위트 스폿(Sweet Spot)은 DDR4-3,733 MHz라고 하는데요. 이는 앞서 언급했던 IF 클록 동기화 문제 때문으로 추측됩니다. 꺾은선 그래프를 통해 알 수 있는 사실은 DDR4-3,866 MHz부터는 메모리와 IF 클록이 2:1 비율로 동작하게 된다는 것인데요. 메모리 레이턴시만 놓고 보자면 DDR4-4,400 MHz(CL18)보다 DDR4-3,200 MHz(CL14) 쪽이 더 나아 보입니다. 하지만 이런 비동기 동작을 통해서 메모리 클록의 적용 범위는 획기적으로 늘렸는데, DDR4-4,200 MHz는 가볍게 적용 가능한 수준이고 DDR4-5,133 MHz까지도 공랭 환경에서 구동이 가능했다고 합니다.

 

 

 

 

 

1906___682952022.jpg
1906___2014427057.jpg
1906___600229808.jpg
 

 

3세대 라이젠 프로세서 중 상위 라인업에 포함되는 AMD 레이스 프리즘(Wraith Prism) 쿨러는 이제 마더보드 제조사의 RGB LED 기술뿐만 아니라 RAZER CHROMA와도 동기화가 가능하다고 합니다. 시스템 튜닝을 염두에 두고 있는 분에게는 더더욱 유용한 소식이겠네요.

 

마지막으로 언급된 내용은 Precision Boost 2, 그리고 PBO 오토매틱 오버클러킹 기능입니다. PBO 기능이 우수한 쿨링 환경에서 메리트를 발휘한다는 것은 이미 1세대 및 2세대 라이젠 프로세서 사용자라면 알고 있는 사실이겠지만, PBO 오토매틱 오버클러킹은 조금 생소할 텐데요. 고급형 마더보드에서 이 기능을 이용하면 최대 클록 주파수 값을 올려 부스트 클록의 헤드룸, 즉 실제 동작 가능한 주파수 범위를 조금 더 높이는 것이 가능하다고 합니다. 위에서 잠깐 다루었던 PBO 오토매틱 오버클러킹 그래프에 의하면 싱글 스레드의 성능을 소폭 향상할 수 있는 것으로 보이는데요. 기존의 XFR을 대체하는 기능이 될 수 있을지는 명확한 확인이 필요하겠습니다.

 

 

 

 

 

 

 

 

 

 

1906___746708312.jpg

 

하나의 다이에 담긴 3개의 칩렛*

SoC 패키징*의 선두주자 : Tom Ley

 

 

* 칩렛(Chiplet) : CPU 패키지 내의 모듈화된 다이를 지칭하는 용어로, 이는 단순히 코어 묶음인 CCX나 CCD 뿐만 아니라 I/O 다이도 포함되는 개념입니다.

 

* SoC(System on Chip) 패키징 : SoC는 단일 칩 시스템이라는 의미로, 여기서 말하는 SoC 패키징이란 다수의 코어 다이와 I/O 다이를 묶어 하나의 칩 위에 구성하는 것과 같이 하나의 다이 위에 통합된 칩을 일컫습니다.

 

 

불도저로 대표되는 CMT 아키텍처를 벗어던지고 라이젠 프로세서가 등장하면서부터, AMD에서는 독특한 변화가 일어났습니다. 오래전 효율성 측면에서 좋지 못한 평가를 받아왔던 MCM을 부활시켰다는 점인데요. 물리적으로 코어가 떨어져 있으면 레이턴시나 동시 작동 면에서 손해가 발생할 수밖에 없습니다. ZEN 아키텍처는 이런 구조적 문제를 해결하기 위한 수단으로 IF, 인피니티 패브릭을 꺼내 들었습니다. 프로세서 내부에서 인터커넥트(Interconnect) 수단으로 활용되는 IF는 단순히 프로세서 내부뿐만 아니라 마더보드 칩세트나 메모리와의 통신에도 적극적으로 활용되고 있죠.

 

분명 모놀리식(Monolithic) 다이 대신 MCM에 근접한 제조 방식을 적용했기에 레이턴시 측면에서는 손해가 발생하겠지만, 구조적인 이득은 무시하기가 어렵습니다. 특히 AMD에서 구현한 HEDT/서버 제품군은 이런 MCM 기술을 기반으로 하여 IF로 다이를 묶는 방식을 활용했기 때문입니다. 절대적인 성능 측면에서는 모놀리식으로 구현된 프로세서가 많은 이득을 가져가지만, 제조 효율 측면에서는 소형 코어 단위(CCX)로 구성된 ZEN 다이가 큰 이득을 취할 수 있겠죠.

 

SoC 방식에 대해 조금 더 거슬러 올라가 보자면, R9 Fury 시리즈가 등장하던 순간부터 AMD의 SoC 패키징 투자가 시작되었을는지도 모르겠습니다. 당시 HBM(High-Bandwidth Memory)은 단가 자체도 높았지만, 이를 GPU 코어와 하나의 다이 위에 쌓는 것은 결코 쉬운 일이 아니었겠죠. R9 NANO가 매우 작은 크기에 당시 강력한 게이밍 성능까지 겸비했던 것을 고려해본다면, AMD의 이런 선행 투자는 라이젠 프로세서에 와서 빛을 발했다는 생각이 듭니다. 물론 두 제조 기술이 동일하지 않기에 직접적인 비교가 어렵기는 하나, 하나의 판 위에 다이나 회로를 여럿 구성하는 인터포저(Interposer)에 대한 노하우는 라이젠 프로세서 그룹과 라데온 그룹 사이에서 충분히 공유가 가능할 수 있으니까요. 여기에, 2세대에 걸친 라이젠/라이젠 스레드리퍼(Threadripper)/에픽(Epyc) 생산 과정에서 얻은 노하우가 더해져 SoC 패키징 분야에서는 제법 앞서가는 입장이 되었습니다.

 

이런 노하우와 구조적인 이점을 바탕으로, 이번 3세대 라이젠 프로세서는 CCD 2개와 I/O 다이를 하나의 칩 위에 얹었습니다. 7nm 제조 공정과 그간의 노하우를 접목했기에 메인스트림 시장에서 최대 16코어라는 숫자를 볼 수 있게 된 셈이죠.

 

 

 

1906___115368391.jpg
1906___1793325502.jpg
1906___1733918851.jpg
1906___1338798352.jpg
 

 

세계 최초의 7nm x86 데스크톱 프로세서, 세계 최초의 PCIe 4.0 적용, 칩렛(Chiplet) 기술의 선도, 새로운 재료와 방법론적인 연구가 업계 최고의 구조적 디자인을 낳았다는 것이 AMD 측의 주장입니다. 인텔이 여전히 10nm 제조 공정에 돌입하지 못하고 있는 작금의 상황을 돌아본다면, AMD의 주장이 마냥 과장되었다고 보기는 어려워졌네요.

 

 

 

 

 

1906___526845422.jpg
1906___1813944678.jpg
1906___621580872.jpg
1906___622739853.jpg
1906___1862102247.jpg
1906___2117513104.jpg
1906___226015953.jpg
 

 

 

칩렛 디자인(Chiplet Design)

 

 

이미 알려진 이야기지만, 3세대 라이젠 프로세서에서는 칩렛 디자인이 적용되었습니다. IF를 이용해 CCD와 I/O 다이를 나누는 것이 가능해졌고, 이를 유기적으로 동작하게끔 구현하는 것도 가능해졌습니다. 모든 코어와 캐시가 활용되더라도 레이턴시가 늘어지는 문제를 막기 위한 별도의 최적화 작업도 진행되었다고 하네요.

 

이렇게 해서 3세대 라이젠 프로세서는 하나의 다이 위에 3개의 칩렛을 탑재하는 것이 가능해졌습니다. 라이젠 프로세서가 세대를 거듭할수록 제조 공정을 낮추고, 이에 따라 배선 간 거리 역시 더욱 밀집될 수밖에 없었는데요. 7nm 제조 공정에 이르러서는 피치가 130μm에 달하기에 AMD의 입장에서도 밀도와 다이 사이즈를 최적화하기 위해서는 도전이 필요했습니다. 기판 제조 자체에도 어려움이 있었다고 하는데, 이는 microPGA 기술을 적용할 수 있는 업체가 세계에서 단 두 곳밖에 없기 때문이라고 하네요.

 

CCD에는 7nm 제조 공정을 활용했지만, I/O 다이에는 12nm 제조 공정을 적용한 이유도 여기에 있습니다. 제조 난이도를 낮추기 위함이죠. I/O 다이의 경우 솔더 범프를 적용하는 것이 비교적 간단하지만, CCD는 난이도가 급증하기 때문에 구리 기둥을 얹는 방식을 사용했습니다. 결국 솔더 범프를 바로 적용할 수 있는 I/O 다이 역시 구리 기둥을 얹은 공법을 사용해야 했죠.

 

구리 기둥을 활용하면 크게 3가지 장점이 있다고 하는데, 더 작게 제조가 가능해지고, 더욱 타이트한 범프 피치에서도 활용이 가능하며, 조립 후 일반적인 다이 높이로 사용이 가능하다고 합니다.

 

 

 

PCIe 4.0의 적용

 

 

여기서 끝이 아닙니다. 3세대 라이젠 프로세서에는 PCIe 4.0이 적용되어 있는데요. 이를 적용하는 과정 역시 험난했다고 합니다. PCIe 4.0은 이전 세대보다 더욱더 까다로운 조건들이 필요한데, 신호에 대한 요구 사항이 더욱 엄격하고, 이를 해결하기 위해 선별된 재료를 활용해야 합니다. AMD 측에서는 이런 문제를 해결하기 위해 패키지 레이어에 손실이 적은 재료를 택했고, AMD가 원하는 수준의 신호 무결성을 달성할 수 있었다고 합니다. 물론 이런 신소재 시장은 언제나 도전 정신을 요구합니다. 차세대 고성능 CPU에 대한 부분은 여전히 미지의 영역이고, 이런 신소재의 활용이, 그리고 PCIe 4.0의 도입이 시스템 성능에 어느 정도로 영향을 끼칠지는 현시점에서 알기 어렵죠. 이를 파악하기 위해 방대한 테스트를 진행하기도 했다고 합니다.

 

결론적으로, 이런 여러 고민과 시도 끝에 3세대 라이젠 프로세서는 모놀리식 프로세서와 동등한 수준의 핀 배열로 탄생했습니다. 물론 내부 구조까지 동일할 수는 없겠죠. 새로운 구조가 적용되었음에도 기존 AM4 플랫폼과의 호환성을 유지하기 위해서는 창의력이 필요했다고 밝히면서, 더 많은 라우팅을 처리할 수 있게 12층 기판을 설계하는 등 다양한 시도가 접목했다고 합니다. 결국 1개 또는 2개의 CCD를 배치할 수 있는 구조를 일반 패키지에서 재사용하는 것이 가능해졌고, 다이 배치 과정에서 메모리 클로킹 또한 최적화할 수 있었다고 하네요.

 

해당 섹션은 실리콘 제조 기술과 관련된 내용이기에 해석도, 이를 받아들이는 측도 난해한 내용이 많았을 것 같습니다. 여기서 중요한 것은 AMD의 입장에서 새로운 제조 공정의 도입과 구조적 변화를 위해 다양한 시도를 과감하게 진행했다는 것, 그리고 기존 AM4 플랫폼과의 유지를 위한 설계 방식이 적용되었다는 것이 키 포인트입니다.

 

 

 

 

 

 

 

 

1906___1942004271.jpg

1906___904756465.jpg

 

고성능을 위한 AMD의 여행은 계속 된다

7nm 제조 공정 및 ZEN 2 아키텍처 소개 : Mark Papermaster

 

 

3세대 라이젠 프로세서의 전반에 대해, 그리고 실리콘 제조 과정에 대해 숨 가쁜 달리기를 해왔습니다. 이번 섹션은 7nm 제조 공정에 대한 소개와 ZEN 2 아키텍처에 대해 간략히 언급하는 시간이었습니다. 이후 이어지는 ZEN 2 아키텍처 섹션에서는 본격적인 아키텍처 소개가 이어집니다.

 

 

 

 

 

1906___4127028.jpg
1906___1356445411.jpg

 

 

ZEN 아키텍처에서 출발한 라이젠 프로세서 개발 주기는 다행히도 큰 문제 없이 착실히 이행되고 있습니다. 2017년에 처음 등장한 1세대 라이젠 프로세서를 시작으로 약 1년 1~2개월의 간격을 두고 3세대 라이젠 프로세서까지 도달했습니다. AMD는 2021년 내로 ZEN 3 아키텍처를 예정하고 있으며, 현재는 ZEN 3 개발을 진행 중(On Track)이라고 합니다.

 

 

 

 

 

1906___1140256796.jpg
1906___442045013.jpg
1906___913900861.jpg
1906___1849567231.jpg
 

 

7nm 제조 공정에 대한 소개는 다음 4가지 키워드로 나눌 수 있습니다. 많은 투자를 요구하는 공정으로 더 빠르고, 더 작고, 더 낮은 전력을 필요로 하는 트랜지스터로 구성됩니다. 12nm 프로세서와 비교했을 때 단위 면적당 2배의 밀도를 지니며, 동일 성능에서 절반 수준의 전력을 소비하며, 동일 전력에서 1.25배의 성능 향상을 가져온다고 하네요. 3세대 라이젠 프로세서는 1세대 라이젠 프로세서와 비교했을 때 최대 15% 수준의 IPC(Instructions per Clock) 향상이 적용되었다고 하는데요. 이는 산업 표준 치보다도 높은 향상 폭입니다.

 

2년 만에 IPC의 큰 향상을 이룩한 까닭에는 향상된 분기 예측, 정수 처리량 증가, 2배로 늘어난 부동소수점 처리 능력, 메모리에 대한 유효 레이턴시 감소를 언급하고 있습니다.

 

 

 

 

 

1906___1999101112.jpg
1906___630714371.jpg
1906___586790252.jpg
1906___565517078.jpg
1906___1872027594.jpg

 

 

프론트 엔드 구성에서는 차세대 명령어 카운터와 새로운 TAGE(TAgged GEometric) 분기 예측기가 도입되었으며, OP 캐시나 명령어 캐시 또한 향상되었습니다. 정수 연산과 부동소수점 연산 성능 향상을 위한 변화도 가미되었네요. ZEN 아키텍처에 들어서면서 가장 크게 부각된 특징 중 하나인 Micro-Ops가 2K에서 4K로 두 배가량 늘어난 부분도 인상적인 대목입니다. 구조적인 부분은 아래에서 다시금 살펴보도록 합시다.

 

3세대 라이젠 프로세서에 적용된 내용 중 가장 눈에 띄는 부분은 바로 캐시 메모리의 2배 증가일 텐데요. L3 캐시 메모리가 2배로 확장되어 유효 메모리 레이턴시를 더욱 효율적으로 개선할 수 있게 되었다고 합니다. 아키텍처의 개선은 고스란히 성능 향상으로 이어졌는데, 코어 클록의 상승분을 제외하더라도 IPC의 향상이 전체 성능 향상치의 60%에 달하는 것을 알 수 있습니다.

 

 

 

 

 

1906___87004954.jpg
1906___687399432.jpg
1906___1662017294.jpg
1906___1361679731.jpg
 

 

보안에 대한 부분도 언급했는데요. ZEN 아키텍처에서는 스펙터를 하드웨어적으로 완벽하게 막을 수는 없었지만, ZEN 2 아키텍처에서는 하드웨어 방어 체계도 구현이 되었다고 합니다. 이후 발표된 멀티칩 접근(Multichip Approach)에 대한 내용은 7nm 실리콘 제조 과정으로 어느 정도 내용이 대체되겠네요.

 

마지막에 첨부된 3세대 라이젠 게이밍 성능이 눈길을 끄는데요. 3세대 라이젠 프로세서와 라이젠 7 2700X의 그래프 수치를 역산 및 조합해보면 아래와 같은 도표를 확인할 수 있습니다.

 

 

 

1906___1885281857.png
 

 

인텔 시스템의 성능은 수치로 기재되지 않았기 때문에 직접적인 비교가 어렵지만, 단순히 2세대 라이젠 프로세서와 비교해보더라도 괄목할 만한 성능 향상을 이룩한 것을 알 수 있습니다. 물론 해당 수치는 평균 프레임 레이트이기에, 실체감 영역에 가장 큰 부분을 차지하는 최소 프레임 레이트를 확인해볼 필요는 있습니다. 재밌는 것은 라이젠 5 3600X의 게이밍 성능인데요. 6코어 12스레드로 구성된 프로세서임에도 2세대 라이젠 프로세서의 최상위 라인업이던 라이젠 7 2700X보다 10~20%가량 높은 게이밍 성능을 발휘했습니다.

 

 

 

 

 

 

 

 

1906___969139514.jpg

 

목표 지점에 도달한 ZEN 2 아키텍처

아키텍처 상세 소개 : Mike Clark

 

 

드디어 마지막 섹션인 아키텍처입니다. AMD 3세대 라이젠 프로세서 그리고 ZEN 2에 관한 프리젠테이션의 최종 장인데요. 게임에서도 최종 보스가 어렵듯, 아키텍처에 관한 부분도 가장 하단에 첨부해두었습니다. 기술적인 지식이 요구되는 파트인 만큼 해석과 이해가 어려울 수 있다는 점 다시 한번 강조합니다.

 

 

 

 

 

1906___1894426257.jpg
1906___669846196.jpg
 

 

ZEN 2 아키텍처를 간략히 도식화한 슬라이드입니다. 하나의 물리적인 코어가 2개의 논리 스레드로 구성되는 SMT 구조는 여전히 유지되며, TAGE(TAgged GEometric) 분기 예측기가 새롭게 투입되었습니다. Micro-Ops는 앞서 언급한 것처럼 2천 개에서 4천 개로 늘어났으며, L3 캐시 역시 ZEN 아키텍처 기반 프로세서와 비교하면 2배로 증가했습니다.

 

정수 유닛은 4개로 이전 ZEN 아키텍처와 동일하지만, 내부 로직에는 약간의 변화가 생겼습니다. 168 레지스터가 180으로 늘어났으며, 스케줄러와 AGU가 각각 하나씩 늘어난 것을 알 수 있습니다. 사이클당 2 Loads + 1 Store로 처리되는 구조 역시 동일합니다(4 pipes, 2 Fadd, 2 Fmul 역시 동일). I-cache는 64K에서 32K로 줄었지만, 4-way가 8-way로 늘어났습니다. TLB(Translation Lookaside Buffer) 부문에서는 큰 변화 점이 보이지 않는 것 같습니다.

 

이외에도 보안 측면의 강화가 더욱 강력하게 적용된 정도가 큰 특징이 되겠습니다.

 

 

 

 

 

1906___615906639.jpg
1906___1706377387.jpg
1906___1007915374.jpg
1906___562174588.jpg
1906___1244692522.jpg
1906___1279219259.jpg
 

 

앞서 언급한 주요 골자에서 조금 더 세부적인 내용으로 들어갑니다. 모든 데이터를 ZEN 아키텍처와 대조적으로 비교하기에는 분량이 많지만, 핵심적인 부분은 성능 개선을 위한 최적화 작업이 추가로 이루어졌다는 것입니다. 단순히 제조 공정의 전환에 그치지 않고 아키텍처의 내부 로직을 개선한 부분이 성능 향상에 더 크게 기여했다는 점은 위에서 이미 살펴본 바가 있죠.

 

 

 

 

 

1906___591093652.jpg
1906___1966675909.jpg
1906___78165104.jpg
 

 

캐시 명령어가 새롭게 도입된 부분 역시 ZEN 2 아키텍처의 특징 중 하나입니다. CLWB(Cache Line Write Back), WBNOINVD(Write Back and Do Not Invalidate Cache), QOS(Quality of Service)가 새롭게 도입되었는데요. 각각의 목적에 맞게끔 도입되었다고 합니다.

 

다음으로는 CCD + cIOD(I/O 다이) 간 통신 구조가 그려져 있습니다. 모든 라이젠 프로세서가 그러하듯, 3세대 라이젠 프로세서 역시 내부 로직의 핵심적인 영역을 담당하는 인터커넥트는 IF가 사용되었습니다. 각각의 CCD는 I/O 다이와 32B/cycle로 통신을 하며, I/O 다이에서 통합 메모리 컨트롤러와 통신을 하여 DRAM에 접근하도록 설계되었습니다. I/O 다이가 외부로 노출된 형태이기에 CCD가 늘어나도 I/O 다이 하나로 접근이 가능하다는 장점이 있죠. 데이터 교환은 고스란히 I/O 다이가 처리해주면 되니까요.

 

 

 

 

 

1906___461677215.jpg
1906___2117300486.jpg
1906___52262457.jpg
1906___1369185678.jpg
1906___936885974.jpg
1906___2026199675.jpg
1906___1384163850.jpg
 

 

3세대 라이젠 프로세서가 이룩한 것들은 놀라운 부분도, 독특한 부분도 공존합니다. 3세대 라이젠 프로세서의 CCX 크기는 2세대 라이젠 프로세서의 60mm²에서 31.3mm²로 줄어 약 47%가량 작아졌습니다. 이런 면적의 이득은 고스란히 코어 수의 증가로 이어져, 궁극적으로는 6코어 12스레드 모델 대비 1.98배의 성능 향상을 보입니다.

 

전력 효율 역시 동급의 경쟁사 프로세서는 물론 2세대 라이젠 프로세서보다 개선된 모습을 보여주었다는 것은 이미 앞에서도 다룬 바가 있는 이야기죠. 전력 효율이 높아졌다는 이야기는, 바꿔 말하면 전력당 성능이 상승했다는 의미이기도 합니다. 라이젠 7 3700X와 라이젠 7 2700X를 비교해보면 그 차이가 극명한데요. 소비전력은 195W → 135W로 줄어들었음에도 와트당 성능은 75%가량 증가했습니다.

 

7nm 제조 공정이 도입되면서 코어 클록 역시 큰 폭으로 증가했는데요. 1세대 라이젠 프로세서가 최대 4.1 GHz를 달성하는 데 그치고, 2세대 라이젠 프로세서가 최대 4.35 GHz 수준에 도달했다면, 3세대 라이젠 프로세서는 4.6 GHz에 육박합니다. 수동으로 오버클록을 적용할 수 있는 한계치가 어느 정도에 달하는지 현시점에서 알기는 어렵지만, 기본적으로 3세대 라이젠 프로세서의 부스트 클록 한계치가 높아졌기에 1세대 및 2세대 라이젠 프로세서보다는 높은 클록 주파수를 적용할 수 있지 않을까 기대됩니다.

 

슬라이드의 마지막 내용으로, IF는 아직 AMD가 만족할 만큼의 효율에는 미치지 못하는 모양입니다. 이 말인즉슨, 여전히 라이젠 프로세서는 개선의 여지가 있다는 거겠죠. 2019년 7월 7일에 정식으로 공개될 ZEN 2를 시작으로, 앞으로 발매될 라이젠이 PC 시장에 얼마나 큰 영향력을 행사할 수 있을지 기대가 됩니다.

 

 

 

 1906___1524498224.jpg
1906___1741292212.jpg 

 

AMD 테크 데이 소개 마무리

7월 7일을 기대하며

 

 

아마도 '역대급'이란 표현이 잘 어울릴 법한 프리젠테이션 분량이 아니었나 생각됩니다. 심지어 본 칼럼은 CPU 파트에 대한 것만 다루었기에, GPU 파트까지 합쳐진다면 그 분량은 실로 어마어마하죠. 여기에 오버클록 행사 및 워너 브라더스 시티 투어, E3 게임쇼로 이어지는 다양한 볼거리 등 AMD에서는 이번 E3 게임쇼 2019를 위해 매우 많은 준비를 했다는 것을 새삼 느낄 수 있었습니다.

 

실컷 슬라이드에 관한 내용을 해석하고 작성한 것과는 대조적으로, 오히려 머리는 차갑게 식는 기분입니다. 이제 ZEN 2 아키텍처와 3세대 라이젠 프로세서에 대한 내용은 모두 공개된 셈입니다. 라이젠 9 3950X의 존재를 숨겼듯, 또 다른 비장의 카드를 숨겼다고 한들 현시점에서는 알 수 없는 이야기죠.

 

AMD의 3세대 라이젠 프로세서가 7nm 제조 공정으로 제조되면서, 드디어 마이크로프로세서에서 최정상의 제조 공정을 적용하게 되었습니다. 경쟁사가 주춤거리는 사이 맹추격을 이어온 AMD의 입장에서, 3세대 라이젠 프로세서의 출시는 그 의미가 남다를 것이라는 생각이 드네요. 물론 슬라이드의 내용이 전부는 아닙니다. 제조사의 입장에서 본다면 자사의 제품이 성능 우위를 점하는 테스트 툴을 사용하지 않을 이유가 없을 것이고, 이는 AMD를 비롯한 대다수의 메이저 제조사가 행하는 작금의 행태이기도 하니까요.

 

 

 

1906___1084213691.jpg

 

 

모든 슬라이드를 곧이곧대로 받아들이실 필요는 없습니다. 내용 중 일부는 실제 테스트로 검증이 필요한 부분도 존재했고, 일부 테스트는 모호하게 표현된 부분도 있었습니다. 하지만 7nm 제조 공정의 적용과 더불어 CPU 및 GPU를 동시에 발표하는 AMD의 기세는 쉬이 꺾일 것 같지 않습니다. 만약 AMD가 공언한 대로 게이밍 성능이 인텔 9세대 코어 시리즈와 대등한 수준을 보인다면, 앞으로 펼쳐질 하드웨어 업계의 전쟁은 더욱더 뜨겁게 달아오를 수 있지 않을까 생각됩니다.

 

하드웨어 계에 빅이슈가 적었던 만큼 이번 발표는 해석도 즐겁게 진행할 수 있었습니다. AMD 테크 데이 CPU 편에 이어, AMD 테크 데이 GPU편을 통해서 NAVI의 따끈따끈한 정보도 얻어서 AMD가 그리는 시스템의 모습을 함께 상상해보는 것도 즐거울 것 같습니다.

 

마지막으로 AMD의 신형 프로세서가 공개되는 7월 7일, 퀘이사존에서 공개할 칼럼도 많은 관심 바랍니다.

 

 

지금까지 퀘이사존 슈아였습니다.

 

1906___1962279373.jpg

 

 

 

 

 

 

 

1906___431586838.png

 

E3 2019 게임쇼 라이브 스트림

5700 XT 50주년 기념 판 그리고 라이젠 9 3950X의 가격 공개

 

 

2019년 6월 11일, 한국 시각 오전 9시부터 AMD의 라이브 스트림이 진행되었습니다. 이미 칼럼 서두에서 다루었던 내용이 주류를 이루긴 했지만, 일부 내용이 추가되거나 보강된 부분이 있었는데요. 특히 눈에 띄는 부분은 5700 XT 50주년 기념 판에 대한 발표, 그리고 이어진 라이젠 9 3950X의 가격 공개였습니다.

 

5700 XT 50주년 기념판에 대한 이야기는 GPU 파트에서 다시금 거론될 테니, 여기서는 라이젠 9 3950X의 가격에 대해 살펴보도록 하죠.

 

상징적인 최상위 라인업, 라이젠 9 3950X가 공개됨과 동시에 라이브 스트림 현장에서 가격도 함께 발표되었습니다. 라이젠 9 3950X의 가격은 $749로, 달러 환율과 부가세를 고려해본다면 100만 원 언저리가 되지 않을까 생각이 듭니다. 부가세를 제외한 금액을 고려하더라도 88만 원 수준이기 때문에 메인스트림 데스크톱 라인업치고는 조금 비싼 감이 없잖아 있는 것이 사실이죠.

 

개인적으로는 라이젠 9 3950X의 가격을 보고나니, 오히려 라이젠 9 3900X가 상당히 공격적인 가격으로 출시했다는 생각이 들었습니다. 이미 현 상태에서도 충분히 강력한데 가격까지 경쟁사 제품과 동급인 $499에 맞추어져 있었기 때문이죠. 7nm로 제조 공정이 더 세밀해지면서 코어가 차지하는 면적은 더 줄어들었지만, 현재 7nm 제조 단가가 절대 저렴하지는 않다고 알려진 만큼 12코어 제품을 메인으로 내세우는 AMD의 선택도 충분히 납득이 갑니다. 라이젠 9 3950X의 높은 부스트 클록을 위해서 생산 수율 과정에서 선별도 진행해야 하리라는 것도 짐작이 가는 부분이죠.

 

물론 16개의 물리적인 코어를 탑재한 메인스트림 괴물, HEDT 라인업까지 위협하는 작업 성능을 기대해볼 수 있는 라이젠 9 3950X 역시 최고의 제품을 선호하는 유저에게 좋은 CPU로 자리 잡을 수 있을 것 같습니다.

 

이제 정말로 AMD의 모든 것이 발표되었습니다. 남은 것은 실제 테스트 성능뿐이네요. 퀘이사존 테스트를 통해 과연 AMD가 발표한 자료가 충분한 신뢰성을 보여주었는지, 7월 7일 그리고 2019년 9월을 기대하시기 바랍니다. 

 

1906___87651343.png

 

 

 

 

 

5865adf4aba1555eb76679ed1c3853e9_1519205


퀘이사존의 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스에 따라 이용할 수 있습니다.​ 



페이스북에 공유 트위터에 공유 구글플러스에 공유 카카오스토리에 공유 네이버밴드에 공유 신고

작성자

현재 레벨 : QM 퀘이사존슈아  QM
14,579 (91.6%)

등록된 서명이 없습니다.

    댓글 : 94
일렉트언니  
베스트 댓글
  
4
Molang  
기다리기 힘드네요 ㅎㅎ
전설의간장게장  
으... 가격...가격... 싼데 비싸다...
Fdw2  
7월 7일이 기대가 됩니다.
ssagag2  
소리 질러~~
demigod117  
16코어에 클럭수도 꽤 높으니 나중에 지금보다 더 많은 코어숫자 필요한 게임 나와도 저거로 원컴방송 하고 그러겠네요ㅋㅋ 아 그때쯤 되면 가성비 더 좋은게 나오려나..?
해바라기믿음  
젠2는 이제 유저들의 꿈과 희망이 되었습니다 ㅎ
탁구2  
기대가됩니다
여행자리오  
여태껏 인텔만 써왔는데 이번에 AMD로 갈아타려고 생각중입니다. 너무 기대되는 라인업이네요 3900X 기대기대^^
ssong152  
그동안 돈을 투자해서 살 만한 제품이 없었던거지, 저정도면 할부 긁어도 되겠다. 가격 자체가 혜자다. 인텔은 그동안 구린 제품을 비싼 가격에 파니까, 돈쓰기가 아까웠던거다.
KorHwy  
으으 먼가 분명 저한텐 16코어는 필요가 없지만 쓸데없는 지름신이.... 텅장을 부르는군요
윤슬  
7월 7일 좋은 성능 착한 가격을 볼 수 있길 기대합니다.
RainyBlueD…  
리뷰가 기다려지는 제품이네요
ChildishAd…  
단순 지표로만봐도, 3800X 면 충분 할 듯 한데, 3900X 가 너무나도 탐이나는군요.

리사수 AMD 아자아자 !
자유로운자유  
젠2 3000시리즈는 정말 역대급 성능을 보여주네요. 작업용은 당연하다고 생각했고, 물론 생각한것보다 좋은 성능이었고 게이밍까지도 성능향상이 있다는 점에 박수를 치고 싶네요. 물론 가격적인 측면이 높아진건 사실이지만, 높은수준의 성능의 제품은 AMD이든 타사든 가격이 높을수 밖에 없겠지요. 라이젠 9 3950X의 성능이 아주 궁금해집니다. 그리고 다음에 나올 아이는 얼마의 잠재력을 가지고 있을지 기대가 됩니다. 앞으로 나올 신기술과 결합시 더좋은 시너지를 보여줄거라 확신합니다.
페이스북에 공유 트위터에 공유 구글플러스에 공유 카카오스토리에 공유 네이버밴드에 공유