AMD NEXT HORIZON GAMING - TECH DAY 라데온 RX 5700 XT/RX 5700 그래픽카드 발표 안녕하세요. 퀘이사존벤치입니다. 오늘은 아주 반가운 소식을 전달해드리려고 합니다. 바로 AMD의 차세대 그래픽카드 관련 소식인데요. AMD 넥스트 호라이즌: 게이밍 테크 데이(AMD Next Horizon: Gaming Tech Day)를 맞아 공개된 라데온 RX 5700 XT/라데온 RX 5700가 그 주인공입니다.
정말 반가운 소식이 아닐 수 없습니다. 그도 그럴 것이 2011년부터 라데온 그래픽카드에 적용되던 GCN 아키텍처(Architecture)에서 드디어 해방되었기 때문이죠. 물론, 그동안 GCN 아키텍처도 꾸준한 개선점과 변화를 갖춰오기는 했습니다. 하지만, 이번 차세대 그래픽카드에 적용된 RDNA 아키텍처 기반 나비(Navi) GPU, 7 nm 공정, PCIe 4.0 인터페이스 지원 등의 요소는 라데온 그래픽카드에 많은 기대를 갖게 해주는 큰 변화들입니다. 특히 유저 입장에서는 AMD가 CPU 시장에서의 광폭행보와 비교하여, 그래픽카드 시장은 너무나 조용했기 때문에, 이번 차세대 그래픽카드 발표 소식은 가뭄의 단비처럼 다가올 것입니다. 저 역시 마찬가지 심정이죠.
이제, 흥분은 조금 가라앉히고 많은 분들이 기다려왔던 AMD 차세대 그래픽카드의 면모를 하나하나 짚어가보도록 하겠습니다. 아마 지금 이 글이 등록된 시점이라면, AMD의 라이브스트리밍까지 모든 행사가 종료되었을 것입니다. 발표 내용에 대한 엠바고로 인해 바로 알려드리지 못한 것인데, 퀘이사존은 행사가 열리고 있는 미국 LA에 위치한 퀘이사존지름님의 취재 정보와 자료를 실시간으로 입수하여 사전에 내용을 정리할 수 있었습니다. 그리고 엠바고 해제 시점인 오전 9시가 되어서야 퀘이사존 회원 여러분께 공개할 수 있게 것이죠. 라이브스트리밍에서 다 밝혀지지 않았던 세부적인 내용과 기술 정보를 본 기사에서 확인하실 수 있을 것입니다. 그럼, 지금부터 7 nm 공정의 새로운 RDNA 아키텍처와 함께 돌아온 라데온 RX 5700 시리즈를 만나보도록 합시다. RX 5700 시리즈의 스펙과 외형 그리고 특징
기본적인 스펙을 먼저 살펴보도록 하죠. 라데온 RX 5700 시리즈는 스펙상 클록을 3 단계로 나눌 수 있습니다. 가장 기본이 되는 베이스 클록, 그리고 게임 클록, 마지막으로 부스트 클록입니다. 부스트 클록의 경우 RX 5700 XT가 1,905 MHz까지 치솟는 것으로 표기되어 있는데 굉장히 높은 수치입니다. 바로 이전에 출시되었던 라데온 7의 최대 부스트 클록이 1,800 MHz였고, RX Vega 64가 1,630 MHz였던 것과 비교해보면 차이가 작지 않기 때문이죠. 그리고 이렇게 3 단계의 클록으로 구성된 형태가 생소하게 느끼실 수가 있는데, 처음이 아닙니다. 과거 RX Vega 64/56의 스펙도 베이스 클록, 부스트 클록, 최대 부스트 클록으로 나누어져 있었기 때문입니다. 지금의 RX 5700 시리즈와 비교하면 명칭이 달라졌다는 것이 차이점이고요.(부스트 클록 -> 게임 클록, 최대 부스트 클록 -> 부스트 클록) '라데온 RX 5700 시리즈의 클록 주파수는 3 단계로 운용' 굳이 이런 클록 명칭까지도 신경을 쓴 것은 아마도 게이밍을 위해 설계된 RDNA 아키텍처의 정체성에 따라 일관된 마케팅 정책을 펼치기 위한 조처로 예상됩니다. 사실, 이름 붙이기 나름이기도 하고요. 그러나, 과거 라데온 그래픽카드의 전례로 봤을 때 실제 게이밍에서 부스트 클록(최대 클록)의 실효성이 얼마나 클지는 의문이 듭니다. 추측하건대 통상적인 게이밍에서는 게임 클록 수준으로 구동되고, 최대 클록은 부하가 낮거나 전력 여유분이 충분한 경우 등의 지극히 제한적인 상황에서 목격될 것으로 예상됩니다. 이렇게 부스트 클록과 관련하여 AMD 본사에 문의 결과 아래와 같은 답변을 내놓았습니다. "게임 클록은 게임 구동 시 보장되는 클록 수준을 말합니다. AMD는 벤치마크에 가장 많이 활용되는 25종의 게임을 대상으로 테스트를 실시하였고, 해당 게임에서 측정된 클록을 평균화하여 게임 클록으로 명명하였습니다." 앞서 게임 클록을 설명함에 있어, 다소 냉소적이었던 제 시선을 돌아보게 하는 답변이 왔습니다. 그저 마케팅적으로 어필하기 위한 명칭은 아니었군요. 직접 게임을 구동해서 얻은 실측값을 바탕으로 게임 클록을 규정했다고 하니 어느 정도가 신뢰가 가는 부분입니다.
라데온 RX 5700 XT는 풀칩(GPU 칩 내의 모든 유닛 활성화) 나비 GPU를 탑재하여, 40개의 컴퓨트 유닛(Compute Unit, 이하 CU)과 2,560개의 스트림프로세서(Stream Processor, 이하 SP)를 갖췄습니다. 이를 통해 1 CU는 64개의 SP로 구성되었다는 것을 알 수 있죠. 256-bit 메모리 인터페이스의 구조적인 요소와 하이엔드급 성능을 표방하는 세그먼트(Segment)가 아니기 때문에 8GB의 GDDR6 VRAM을 갖추고 있습니다. 매우 넉넉하다고 할 수는 없고, GPU 성능을 고려했을 때 적당한 메모리 구성입니다.(지포스의 경우 RTX 2080까지 8GB, RTX 2080 Ti는 11GB) 그 외 256-bit 메모리 인터페이스와 14 Gbps(유효 메모리 클록: 14,000 MHz)의 동작 속도로 메모리 대역폭은 448 GB/s가 됩니다. 수치적으로는 지포스 RTX 2080/RTX 2070과 동일한 수준입니다. '라데온 RX 5700 XT는 40 CU, RX 5700은 36 CU' 반면, 라데온 RX 5700은 XT 버전에서 4개의 CU가 비활성화된 컷칩 나비 GPU를 탑재하였습니다. 2,304개의 스트림프로세서와 XT 대비 상대적으로 낮은 클록으로 작동하여 성능에 차등을 두게 됩니다. 근본적으로는 같은 GPU를 탑재하고 있기 때문에 소비전력은 큰 차이가 나지 않겠으나, 낮은 클록에는 낮은 전압이 따라오게 되므로 TDP 역시 225W의 XT보다 낮은 180W를 가지게 됩니다.
앞서 언급한 3 단계의 클록 운용 시스템 개요입니다. 부스트 클록은 일반적인 게이밍에서 상시 기대하기는 힘든 최대 클록 개념이며, 게임 클록이 실제 성능에 가장 밀접한 관계가 있는 수치입니다. 베이스 클록의 경우 TDP를 초과하는 매우 높은 부하를 보일 때 적용되는 클록입니다. 클록과 전압을 함께 낮춰 소비전력 및 발열에 제한을 가하는 알고리즘인데요. 기술 개념 상, 부스트 클록을 운용하는 최신 그래픽카드 대부분이 이와 유사한 알고리즘으로 작동합니다.
또한, 최신 디스플레이 환경에 대응하는 라데온 디스플레이 엔진이 적용되었습니다. RX 5700 시리즈는 AMD 라데온 프리싱크 2 HDR(RADEON FREESYNC 2 HDR)를 지원하는데요. 이를 위해 HDMI 2.0b, DisplayPort 1.4 HDR 지원 포트를 장착했습니다. 또한, 디스플레이 스트림 압축(Display Stream Compression, 이하 DSC) 1.2a가 적용되어 고해상도와 고주사율 정보를 디스플레이에 전송할 수 있습니다. 대표적으로 4K 240 Hz, 4K HDR 120 Hz, 8K HDR 60 Hz를 명시해놓았군요. DSC는 VESA에서 만든 오픈 스탠다드로 4K 240 Hz까지 지원합니다. 여기서 HDR을 적용하는 경우 120 Hz로 제한되며, 144 Hz의 경우 지금은 크로마 서브샘플링(Chroma subsampling)을 적용하는 것으로 구현이 가능하지만, 라데온 디스플레이 엔진은 오리지널 이미지 품질을 보장하면서 높은 주사율을 지원합니다. 즉 단일 DP 케이블로 4K 144 Hz와 프리싱크 2 HDR을 간편하게 구성할 수 있다는 뜻이죠. 이와 함께 DSC 모니터도 함께 소개하고 있습니다. ASUS 모니터 제품으로, 프리싱크 2 HDR과 4K 144 Hz, Display HDR 1000, DP 1.4 DSC를 지원합니다.
라데온 미디어 엔진으로 최신 미디어 환경에도 대응책을 갖췄습니다. 심리스 스트리밍(Seamless Streaming)을 내걸며 H.264/H.265/VP9 코덱에서 고해상도/고주사율을 지원합니다. 또한, 미디어 엔진은 소프트웨어 방식이 아닌 하드웨어적 차원에서 나비 GPU 내 별도의 칩이 프로세싱을 담당합니다.
그리고 게임용 그래픽카드로서는 최초로 PCIe 4.0 인터페이스를 지원한다는 점 역시 중요한 정보입니다. PCIe는 PCI SIG에서 규정하고 있는 직렬 방식 인터페이스이며, 현재 그래픽카드 분야에서 주류를 이루고 있는 버전은 PCIe 3.0입니다. PCIe 4.0은 16 레인(x16) 기준 31.51 GB/s의 대역폭을 가지며, 이는 PCIe 3.0의 15.75 GB/s와 비교했을 때 2배에 해당합니다. 'PCIe 4.0은 게이밍 성능보다 지원 자체에 의의' 이론적인 수치만 보면 엄청난 차이가 맞지만, 이것이 그대로 게임 성능의 차이로 귀결되기란 쉽지 않습니다. 현재 출시되어 있는 가장 높은 게이밍 성능의 RTX 2080 Ti도 PCIe 3.0 x16과 x8의 성능 차이가 크지 않기 때문이죠. 이는 PCIe 대역폭이 현상황에서 크게 모자라지 않는다는 것을 방증합니다. 따라서 게이밍 성능보다는 일부 제한적인 시스템/프로그램에서의 효용성을 기대하는 것이 좋습니다. 실제로 PCIe 4.0은 서버/워크스테이션 용도의 시스템에서는 진작 지원되고 있었던 상황이기도 합니다. 결국 라데온 RX 5700 시리즈의 PCIe 4.0 지원에 큰 기대를 갖고 지나친 의미를 부여하기보다는, 최신 인터페이스를 적용하여 GPU 성능을 최대한 끌어낼 수 있다 정도로 이해하는 것이 좋습니다.
라데온 RX 5700 XT의 레퍼런스 카드 디자인을 감상해볼 시간입니다. 그동안 AMD가 선보인 라데온 그래픽카드 시리즈는 반듯하면서도 각진 디자인을 고수하며 고유의 감성을 유저들에게 각인시켰는데요. 이번에도 마찬가지입니다. 다만, 기존 세대의 디자인에서 디테일 요소를 첨가해 고급스러움과 개성을 한 스푼 더한 것으로 보입니다. 하우징은 알루미늄 알로이의 슈라우드와 백플레이트가 탑재되었고, 공기 역학을 고려한 물리적 설계와 증기 챔버 쿨링(Vapor Chamber Cooling) 방식을 적용했습니다. 블로워팬 타입의 쿨러로서는 AMD 입장에서 할 수 있는 최선을 다한 결과물로 판단되는데, 사실, 그동안 AMD의 레퍼런스 쿨러는 부정적인 평가가 더 많았다는 사실이 불현듯 머리를 스칩니다. 무엇보다 경쟁사에 비해 시끄러웠기 때문이죠. 이번 RX 5700 시리즈는 얼마나 소음이 개선되었을 지 여부도 확실히 검증해볼 예정입니다. 어서 빨리 샘플을 입수하여 굴려보고 싶은 마음이군요. '출시 직후에는 레퍼런스 모델만 판매, 커스텀 모델은 차후 출시' 레퍼런스 쿨러 디자인과 관련하여 AMD 본사 측의 부연 설명에 따르면, 역동적인 움직임을 담아내기 위해 노력했고, 블로워 팬의 소음을 최소화하기 위한 설계가 적용되었다고 합니다. 또한, 레퍼런스 디자인의 그래픽카드가 먼저 출시될 예정이며, AIB 커스텀 그래픽카드는 차후 판매될 예정입니다. 레퍼런스 모델과 커스텀 모델이 동시에 출시되지 않는다는 뜻이겠죠. RX 5700 시리즈에 많은 공을 들였기 때문에, 이로 말미 암아 브랜드 마케팅에도 세심한 접근 방법을 택한 것으로 보입니다. RX 5700 XT/RX 5700의 게이밍 성능
자, 저를 포함한 많은 퀘이사존 회원분들이 가장 중요하게 여기고 또 궁금해하실 게이밍 성능입니다. 본 게이밍 성능을 보기 전에 자료로 제시된 내용들은 모두 AMD가 제공한 공식 테스트 자료임을 감안해주시길 바랍니다. 즉 자사의 제품이 조금이라도 유리한 조건을 갖도록 설정했을 가능성이 충분하다는 뜻이죠. 제 경험상 테스트 결과의 데이터값 자체는 최종 샘플 테스트 결과와 크게 다르지 않지만, 자료가 제작되는 과정에서 게임 선정과 옵션, 시스템 설정 등은 오로지 AMD의 판단으로 이루어진 것이기에 유연하고 폭 넓은 해석이 필요합니다. 물론, 이와 같은 내용은 인텔과 엔비디아 등 다른 제조사에도 동일하게 적용됩니다.
첫 번째로 라데온 RX 5700 XT입니다. RX Vega 64가 아닌 RX Vega 56과 비교하고 있군요. 사실, RX 5700 XT는 스펙으로 보나 AMD의 전략으로 보나 RX Vega 64보다는 분명 조금이라도 뛰어날 것으로 예상되는 그래픽카드입니다. 하지만 그 성능 차이가 드라마틱한 수준이 아닐 것이기에 RX Vega 56과 비교한 것으로 추측되네요. 전반적으로 20% 이상의 차이를 꾸준히 내어주고 있고, 일부 게임에서는 30~40%에 달하는 성능 차이도 나타납니다. 특히 더트 랠리 2와 메트로 엑소더스에서의 성능 차이가 인상적입니다. RX Vega 64와 RX Vega 56의 전반적인 성능 차이가 20% 안 쪽이라는 사실을 떠올려보면, 앞서 말씀드렸듯이 RX 5700 XT는 RX Vega 64의 성능도 뛰어넘을 가능성이 매우 큽니다.
인상적인 자료가 또 있는데요. 1920x1080 해상도에서의 RX Vega 56 성능보다 2560x1440 해상도를 적용한 RX 5700 XT의 성능이 동급이거나 혹은 더 뛰어난 성능을 제공해준다는 내용입니다. RX Vega 56 사용자 입장에서 1080p 디스플레이를 1440p 디스플레이로 변경할 경우, RX 5700 XT 그래픽카드를 구매한다면 성능 저하 없이 게이밍을 즐길 수 있다는 취지로 해석됩니다.
'RX 5700 XT는 RTX 2070을 소폭 앞서는 성능' GCN 아키텍처와의 비교보다 더 재밌는 경쟁사 그래픽카드와의 비교입니다. 바로 엔비디아의 지포스 RTX 2070과의 비교인데요. 성능이 떨어지는 게임도 있지만 전반적으로 RX 5700 XT가 소폭 앞서는 모습입니다. 성능 차이가 크게 벌어지는 경우에는 약 20% 수치까지도 관측이 되는 결과인데요. 이렇게 되면 RTX 2080은 라데온 7이 경쟁하고 RTX 2070은 RX 5700 XT가 경쟁하는 구도로 바라볼 수 있습니다. 물론, 관건은 가격입니다만 아직 공개되지 않았으니 넘어가도록 합시다. 더군다나 지포스는 정체를 알 수 없는 ‘Super’ 티저와 함께 튜링 리프레시(Refresh) 루머도 들려오고 있는 시점이기에 정확한 구도 예측은 여러모로 힘든 상황입니다.
'RX 5700은 RTX 2060보다 뛰어난 성능' 다음은 RX 5700과 RTX 2060의 게임 성능 비교입니다. AMD가 RTX 2060과 직접 비교한 것인데, 그렇다면 적어도 RTX 2060과 동급 혹은 그 이하의 가격대를 기대해봐도 되겠군요. 전반적으로 낮게는 5% 높게는 20% 정도의 성능 차이를 보여주는데, 액면 그대로 해석하면 RTX 2060보다 확실히 매력적인 성능으로 보입니다. 또한, VRAM도 RX 5700이 2GB 더 많으니까요.
라데온… 과연 궁극의 게이밍 플랫폼이 될 수 있을까요? 현재 라데온 RX 5700 XT/RX 5700의 가격은 공개되지 않은 상황입니다. 아마도 AMD 입장에서는 2019년 7월, 출시 직전까지도 시장 상황을 고려하여 최종 가격을 정할 것으로 예상됩니다. 지포스의 행보가 정확히 드러난 바가 없어 속된 말로 간을 볼 수밖에 없는 상황인데요. 무엇보다 가격대가 매우 중요한 포지셔닝의 제품인 만큼 뛰어난 가성비로 시장에 반향을 일으키길 기대합니다. 나비 GPU 그리고 RDNA 아키텍처
지금까지 RDNA 아키텍처 기반의 나비 GPU를 탑재한 RX 5700 시리즈 그래픽카드를 알아보았는데요. 좀 더 심화과정으로 RDNA 아키텍처에 접근해보려고 합니다. AMD가 제공한 슬라이드 이미지에 비교적 구체적인 정보가 담겨 있는데, 하나씩 뜯어보도록 하겠습니다. 새로운 아키텍처, 7 nm 공정, GDDR6, PCIe 4.0 우선, 나비 GPU 패밀리의 특징입니다. RDNA 아키텍처로 진화되어 게이밍 성능에 최적화된 구조를 내세우고 있습니다. 7 nm 공정과 GDDR6 메모리도 등장했군요. 또한, 게이밍 GPU로서는 최초로 PCIe 4.0 인터페이스를 지원합니다. 물론, 하위호환을 지원하기 때문에 기존의 PCIe 플랫폼에서도 사용 가능합니다. 그 외 앞서 설명드린 라데온 미디어 엔진과 디스플레이 엔진을 포함하고 있습니다.
RDNA 아키텍처는 게이밍의 미래를 위해 설계되었다고 합니다. 기존 GCN 아키텍처에 비해 순수 게이밍 성능과 효율에 초점이 맞춰진 아키텍처로 해석할 수 있는 부분이죠. 아키텍처 상에 유기적으로 연결된 유닛들이 게임이 필요로 하는 연산 종류와 워크로드를 고려하여 설계된 것이 대표적인 특징인데, 결국 공정 미세화로 인한 효율 향상 외에도 아키텍처 개선으로 인한 성능 효율 향상을 기대할 수 있습니다.
RX 5700 시리즈에 탑재된 나비 GPU의 블록 다이어그램(Block Diagram)입니다. GCN 아키텍처와 비교하여 많은 부문에서 차이를 보이는군요. 시각적으로 드러나는 가장 큰 차이점은 컴퓨트 유닛(Compute Unit, 이하 CU) 2개가 Dual CU로 묶여 하나의 그룹을 형성하고 있다는 것입니다. 다양한 워크로드에 유연성 있는 운용을 위한 것으로 보이는데, 슬라이드 이미지에서 내부 알고리즘을 자세히 살펴볼 수 있습니다. 그리고 멀티레벨 캐시 구조를 채택하여 낮은 레이턴시(Latency)와 높은 대역폭, 저전력을 특징으로 꼽았으며, 스트림라인 그래픽 파이프라인 구조로 클록 주파수 당 성능 효율도 끌어 올렸습니다.
위 이미지가 바로 RDNA 아키텍처의 새로운 CU 디자인입니다. 1 CU에는 64개의 스트림프로세서(Stream Processor, 이하 SP)와 2X 스케줄러, 2X 스칼라 유닛으로 구성되는데요. GCN 아키텍처와의 결정적 차이가 바로 여기에 있습니다. RDNA 아키텍처는 게임별로 서로 다르게 요구되는 워크로드 형태에 대응하고, 동시에 최적화된 성능을 제공하기 위해 2개의 CU를 묶어 하나의 워크 그룹 프로세서로 취급하도록 하였습니다. 지포스 튜링(Turing) 아키텍처의 경우 이와 같은 관점에서 하이브리드 워크로드 모델을 적용하여, 연산 과정을 최적화시킨 바 있는데, AMD는 조금 다른 측면에서 묘책을 내놓은 것입니다. 이렇게 되면 워크 그룹 프로세서 내의 2 CU가 획일화된 워크로드에 부하가 걸려 애플리케이션이 요구하는 워크로드에 유연하게 대처할 수 있게 되죠. 또한, 스칼라 유닛(Scalar Units)과 스케줄러(Schedulers)는 2 CU와 유기적으로 연결되는 논리적 구조로 설계되었기 때문에, 사실상 하나의 워크 그룹 프로세서라는 AMD의 주장에 유효한 논거가 됩니다.
결국 RDNA 아키텍처의 CU 구조 변화는 GCN 아키텍처에 비해 레이턴시를 낮추고, 싱글 스레드 성능을 향상시키며, 캐시 효율도 개선시킬 수 있습니다. 최신 게임에 최대한 좋은 성능을 내어줄 수 있도록 고민한 흔적으로 볼 수 있죠. 하나 더, 멀티레벨 캐시 구조를 통해 데이터 입출력의 효율을 향상시킨 부분입니다. 이미지를 참조하면, GCN과 비교하여 캐시 계층(Level)간 레이턴시 감소 효율을 살펴볼 수 있는데요. L0과 L1+L2 단에서 20% 이상 레이턴시를 감소시켰습니다. 또한, 델타 컬러 압축(Delta Color Compression, 이하 DCC) 알고리즘을 향상시켜 최종 렌더링 파이프라인에 이르기까지의 입출력 데이터 효율 개선도 눈여겨볼 부분입니다.
다음은 스트림라인 그래픽 파이프라인(Streamlined Graphics Pipeline)입니다. 아키텍처의 구조적 차원에서 성능 향상을 꾀할 수 있는 구조이며, 전력 효율을 위해 Hyper-Effective 클록 게이팅(Clock Gating)이 적용되었습니다. 클록 게이팅은 CPU의 저전력 기술로써도 많이 활용되는 데, 쉽게 말해서 불필요한 영역의 클록 인가를 차단(Gating)하여, 전력을 절감하되 성능 발휘에는 문제가 없게끔 하는 개념입니다. 자료를 참고하면, RDNA 아키텍처는 GCN 아키텍처에 비해 클록 당 성능이 25% 높습니다. 그리고 클록 당 유효 게이트는 GCN의 88% 수준(-12%)이고요. 이와 같은 차이를 종합했을 때 RDNA는 GCN에 비해 클록 당 성능 효율이 매우 우수해지게 됩니다.
정리하면, RDNA 아키텍처 기반의 라데온 그래픽카드는 GCN 아키텍처와 동일한 규모의 유닛 구성과 클록을 가지더라도 더 높은 성능을 내어줄 수 있는 것으로 이해하시면 됩니다. 그래픽카드로 예를 들어보죠. RX Vega 64만 하더라도 4,096개의 SP와 1,546 MHz의 부스트 클록으로 12.7 TFLOPS의 FP32 연산 성능을 가지지만, RX 5700 XT는 2,560개의 SP와 1,755 MHz의 게임 클록(RX Vega 64의 부스트 클록에 해당하는 클록 단계)으로 FP32는 9.0 TFLOPS 수준에 그칩니다. 그러나 AMD 자료에 따르면, 실제 게임 성능은 RX Vega 64보다 뛰어날 것으로 예상되죠. 즉 서로 다른 아키텍처는 겉으로 드러나는 수치로는 비교가 힘든 것입니다. 물론, 클록 효율을 말함에 있어 FP32로 접근하는 것은 정확한 비유가 될 수 없지만 쉬운 이해를 위해 예시로 든 것이니 양해 부탁드립니다. AMD는 RDNA의 최종 성능 효율을 GCN에 비해 50%가 더 높다는 결론을 내렸습니다. 효율을 그대로 FLOPS에 대입하면 RX 5700 XT는 9.0 x 1.5 = 13.5 TFLOPS가 되는군요.(대략적인 추측을 위한 것으로 정확한 접근법이 아닙니다) RX Vega 64의 12.5 TFLOPS보다 약 8% 높은 수치입니다. 이 외에도 많은 부문에서 두 아키텍처가 차이를 보이고 있기 때문에, 남은 변수는 많습니다만 흥미로운 접근법이 될 수 있습니다. 순수하게 아키텍처적인 관점에서 GCN 대비 RDNA의 성능 개선 1등 공신은 클록 성능 향상(6할을 차지)이고, 나머지는 공정 개선과 전력 운용 개선으로 설명하고 있습니다. 기존의 라데온 7/RX Vega 64 수준의 다이 면적과 소비전력을 운용하게 되면 훨씬 더 드라마틱한 성능을 내어줄 수 있다는 말이죠.
최종 정리하겠습니다. 결과적으로 나비 GPU는 기존의 RX Vega 64와 비교하여 성능은 끌어올리고, 소비전력을 절감시켜 1.5배에 달하는 전성비를 달성했다고 합니다. 근데 위 그래프에서 등장한 나비 GPU를 그대로 RX 5700 XT와 등치할 수 있는지 여부는 장담하기 어렵습니다. 조금 조심스러운 해석이 필요한데, AMD 측에서 레퍼런스로 삼은 클록 주파수가 달라서 그랬던 건지 아니면 단순히 RX 5700 XT의 표기를 나비로 한 것인지 알 수 없기 때문이죠. 오른쪽 섹션에서는 재밌는 접근으로 비교합니다. 다이면적 당 성능을 말하고 있네요. 줄여서 면성비라고 해야할까요? 어쨌든 아키텍처 개선과 공정미세화의 힘으로 나비 GPU는 RX Vega 64 대비 2.3배의 면성비를 달성했다고 합니다.
이번 발표에서 레이트레이싱 관련 AMD의 비전을 밝히기도 했는데요. 현 GCN/RDNA 아키텍처 체제에서는 셰이더 차원의 지원(프로렌더, 라데온레이 등)을 이어가고, 차세대 RDNA 아키텍처에서 하드웨어 차원의 레이트레이싱을 지원할 예정입니다. 지포스가 선제적으로 레이트레이싱 화두를 던진 것에 재빠른 대응은 못하는 상황인데, 이미 늦었으니 잘 여문 완성도를 보여주기 바랍니다. 그리고 다음 단계의 레이트레이싱은 클라우드 플랫폼입니다. 막강한 컴퓨팅 성능의 중앙 시스템이 전체신(Full Scene)에 대한 레이트레이싱 연산을 담당하는 것이죠. 이렇게 되면 개인 시스템은 상대적으로 상당한 연산 부담을 덜 수 있기 때문에, 쾌적하게 고품질 게이밍을 즐길 수 있을 것입니다. 그러나 아직까지는 비전이니까 참고만 하도록 합시다. 마지막으로 아키텍처 로드맵입니다. 올해 7월 출시로 예정된 RX 5700 XT/RX 5700의 RDNA 아키텍처 외에도 7 nm+ 공정의 RDNA 2 아키텍처가 예정되어 있습니다. CPU 시장에서의 라이젠처럼 그래픽카드 시장 역시 AMD의 지속적이고 매력적인 그래픽카드 출시를 기대해보도록 하겠습니다. 그동안 너무 부진했으니까요. AMD 아드레날린 2019 에디션 업데이트
하드웨어에 대해 실컷 떠들었으니 이제 소프트웨어를 살펴볼까 합니다. AMD의 라데온 그래픽 드라이버는 자기반성과 엔비디아와의 경쟁을 통해 놀라운 발전을 지속하고 있죠. 물론, 과거에 워낙 악명이 높았던 탓에 더 크게 와닿는 느낌도 있지만, 어쨌든 이제 AMD 드라이버에 대한 편견은 상당 부문 해소된 상황이죠. 다시 본론으로 돌아와 이번 RX 5700 XT 발표와 함께 공개된 AMD 라데온 아드레날린 에디션 드라이버를 살펴보도록 하겠습니다. 어떤 면에서는 경쟁사의 드라이버에 포함된 기능을 뛰어넘어 흥미롭고 유용해보이는 기능들도 발견할 수 있었습니다.
새롭게 추가된 요소로 Automatic Low Latency Mode, Settings Snapshot, 와트맨(Wattman)에 대한 UI 기능 개선 등을 꼽았습니다. 특히 레이턴시를 자동으로 낮춰주는 기능이 굉장한 흥미를 유발하는 데 이건 잠시 후에 자세히 다뤄보도록 하겠습니다. 스냅샷 기능의 경우 단순 캡처뿐만 아니라 사용자 취향의 세팅값을 프리셋으로 지정하여 저장하거나 불러오는 기능을 포함하고 있는데, 스냅샷을 활용한 커뮤니티 활동을 즐기는 유저들에게는 환영받을 만한 기능입니다.
'응답속도를 개선시키는 RADEON ANTI-LAG' 단어 뜻 그대로 랙을 줄이는 기술인데, 줄여서 RAL로 설명하겠습니다. 사실, 굉장히 미묘한 영역이라 직접 검증하거나 체감하기 전까지는 효용성에 대해 확언하기 어려운 측면이 있습니다. RAL을 통해 빠른 응답 속도가 굉장히 중요한 e스포츠 게이밍, 높은 FPS 환경과 유사한 수준의 응답 속도, 게임과 더욱더 밀접하게 연결된 느낌을 전달해줄 수 있다고 하는데 이건 정말 꼭 확인해보고 싶군요.
RAL 기술 개요입니다. 이상적인 게이밍 시나리오라면, GPU가 한 장의 프레임을 렌더링 하는 시간에 해당하는 만큼만 지연시간(이미지 상에서는 Lag time으로 표기됨)이 발생하는 것이 좋습니다. 만약 초당 60 프레임으로 렌더링 되고 있는 상황일 경우, 프레임 지연시간은 1초를 60으로 나눈 16.67 ms가 되겠지만, 이론과 현실은 다릅니다. 실제 게이밍에서의 3D 렌더링은 GPU와 CPU가 모두 관여하게 되고, 이 과정에서 불규칙적인 지연시간과 변수가 발생하게 됩니다. 따라서 이상적인 시나리오를 벗어나 체감 가능한 지연시간은 얼마든지 발생할 수 있게 되지요. 여기서 RAL이 개입하여 프레임 간 지연시간을 조절하고, 좀 더 균일하고 낮은 지연시간을 확보할 수 있게 도와줍니다.
이렇게 마우스 클릭(입력장치로부터의 입력)부터 디스플레이 반영까지 소요되는 시간을 측정한 결과, RAL 기능을 활성화했을 때 지연시간이 작게는 23%, 크게는 35%까지 감소되는 효과를 누릴 수 있다고 합니다. 구체적인 작동 알고리즘이 나오지 않았고, AMD 측의 자료이기 때문에 너무 큰 기대는 경계해야겠습니다만, 멀티플레이를 즐기는 게이머 입장에서는 굉장히 좋은 기능입니다. 미세한 지연시간 차이로 인해 게임 체감은 얼마든지 달라질 수 있기 때문이죠. 해당 기능과 관련하여 AMD는 라이브스트리밍을 통해 RTX 2070과의 지연시간을 비교하기도 하였습니다. RTX 2070은 59.0 ms, RX 5700 XT는 44.1 ms의 지연시간을 보여주었는데요. 상당한 차이입니다. 다양한 게임 타이틀에서 이와 같은 효과를 보장한다면, 좋은 평가를 내리고 싶은 기술입니다.
'명암 대비를 활용한 RADEON IMAGE SHARPENING' 게임 화면의 선명도를 향상시켜주는 RIS도 포함되었습니다. 렌더링된 이미지를 분석하여 명암차가 존재하는 영역의 대비를 향상시키는 기술인데요. 흔히 그래픽 편집 애플리케이션에서 사용하는 ‘부분 대비’ 효과와 유사한 알고리즘을 적용하는 것으로 판단됩니다. RIS 적용 시에는 좀 더 선명한 느낌을 받을 수 있으면서도 성능 저하는 거의 없다고 하는군요. 그런데 이런 후처리 기술은 이미지 형태에 따라서 오히려 원본이 나은 경우도 종종 발생할 가능성이 있습니다. 어쨌든 제작자가 의도하지 않은 이미지로 가공되는 것이니까요. 그러나, 화질에 민감한 사용자 입장에서는 드라이버 차원의 이미지 향상 기술이 흥미롭고 게이밍 경험을 더 즐겁게 만들어주는 중요한 도구가 되어줍니다. 어차피 취향에 따라 켜고 끌 수 있기 때문에, 없는 것보다는 있는 것이 나으니까요.
AMD는 RIS의 이미지 선명 기법을 어필하기 위해 비교샷을 제공하였는데요. RIS를 활성화하면 바위의 텍스처맵 질감(대표적으로 잔 흠집)이 더 강조되는 느낌을 받게 됩니다. 밝고 어두운 영역이 비교적 명확히 드러나는 영역을 집중적으로 프로세싱하는 알고리즘 때문인데요. 이를 통해 나뭇잎의 세밀한 묘사력도 체감적으로는 더 뛰어난 것으로 느껴지게 됩니다. 물론, 이런 세심한 요소에 민감하지 않은 유저에게는 감흥이 크지 않겠죠. 어떤 기술이든지 사람에 따라서 받아들이는 감흥의 강도는 다를 수 있습니다.
RIS 역시 엄연히 GPU 파워가 요구되는 작업이기 때문에 성능 저하가 발생합니다. 하지만, 고작 1% 내외의 차이이기 때문에, 성능 저하를 이유로 RIS를 사용하지 못하는 일은 없을 것 같군요. 이 정도면 사실상 성능 차이가 없다고 봐도 좋습니다. AMD의 테스트가 정확했다는 가정 하에 말이죠.
RIS는 수많은 게임에서 지원될 예정입니다. 텍스트로 꽉 차 있는 슬라이드 이미지를 봐주시길 바랍니다. 하나하나 언급할 필요는 없겠죠. 이런 후처리 기능은 AMD의 주장처럼 호환성을 크게 타지 않기 때문에 많은 게임에서 즐거운 활용이 가능할 것으로 예상됩니다.
개발자에게 오픈소스로 제공되는 AMD FidelityFX 툴킷에 포함된 CAS(Contrast Adaptive Sharpening) 역시 이미지 선명도 향상 알고리즘 기법인데요. 다양한 AA(Anti-Aliasing)와 병합하여 사용 가능하고, 성능 저하는 거의 없이 시각적으로 만족도가 높은 결과물을 가져다줍니다. 화면 상에서도 아스팔트 매핑 질감과, 타이어 표면에서 차이를 확인할 수 있죠. 보더랜드 3에서의 비교샷 역시 마찬가지입니다.
또한, 제조사에서 발표하는 기술들은 막상 필드에서 운용해보면 좁혀지지 않는 간극이 발생하는 경우가 종종 있는데, 이 괴리감에 대한 분석과 검증은 저희 퀘이사존이 담당할 역할이 되겠습니다. AMD가 주장했던 라이젠 3000 시리즈 + 라데온 RX 5700 = 궁극의 게이밍 플랫폼 공식이 머릿속에서 떠나가질 않는군요. 정말로 간절히 검증해보고 싶은 주제입니다.
'엑스박스 게임패스 PC 3개월 구독권 무료 제공' 그리고 양질의 게임 프로모션으로 일명 쿠성비(게임 타이틀 쿠폰에 대한 만족도)가 뛰어나다고 평가받는 AMD 답게 이번에도 게임 프로모션이 포함되어 있습니다. 바로 엑스박스 게임패스 PC(Xbox Game Pass PC) 3개월 구독권인데요. AMD 라데온 RX 5700 시리즈 또는 라이젠 프로세서 구매자에게 제공됩니다. 게임패스 PC는 이번 E3 2019를 맞이하여 마이크로소프트가 발표한 게임 구독 서비스입니다. 앞에 엑스박스가 포함되어 콘솔 게임기로 혼동할 수 있지만 엑스박스는 콘솔에 한정된 명칭이 아니라 마이크로소프트가 제공하는 게이밍 플랫폼 전체를 규정하는 브랜드입니다. 즉 PC 기반의 윈도우 10 플랫폼도 포함된다는 뜻이죠. 게임패스 PC를 구독하게 되면, 마이크로소프트가 제공하는 수십~수백종에 이르는 게임을 얼마든지 즐길 수 있습니다. 월 이용료는 $9.99에 책정되어 있지만, 현재 베타 서비스 기간으로 50% 할인된 가격인 $4.99로 책정되어 있습니다. 마이크로소프트에 따르면 올 가을 출시 예정인 기어스 5(Gears 5, Gears of War 4의 정식 후속작)도 게임패스 PC에 포함되고, 100개 이상의 게임이 제공될 예정이라고 합니다. 여러모로 게이머에게는 좋은 프로모션으로 볼 수 있겠죠. 과거와 달리 적극적으로 게이머에게 어필하려는 노력은 칭찬 받아 마땅합니다.
이렇게 다양한 기능들과 새로운 기술로 무장한 AMD 라데온 소프트웨어 아드레날린 2019 그리고 앞서 살펴봤던 RX 5700 그래픽카드와 RDNA 아키텍처까지 모든 내용을 살펴보았습니다. 새삼 이번에 AMD가 참 많은 것을 준비하고 또 연구해왔다는 것을 느끼게 해주는데요. 심지어 흥미롭고 뛰어난 기술들이 너무 한꺼번에 쏟아져 나와 어디에 초점을 두어야 할지 혼란스럽기도 합니다. 하지만, 핵심은 결국 성능으로 대변되는 결과물입니다. 아무리 뛰어난 아키텍처와 기술, 기능을 포함했다고 해도 결국 게이머에게 가장 중요한 건 가격, 그리고 성능, 제품 포지션 등의 실질적인 열매인 것이죠. 열매가 맛 없으면 구매할 이유가 없기 때문입니다. 아무쪼록 AMD가 굉장히 많은 공을 들이고 나온 제품들인 만큼, 이 새로운 하드웨어가 새로운 플랫폼과 함께 높은 시너지 효과를 발휘하길 바랍니다. 이상, 퀘이사존벤치였습니다. 아니, 그런데!! 라데온 RX 5700 XT = $449 라데온 RX 5700 = $379
글을 다 작성해놓은 시점 이후 진행된 AMD 라이브스트리밍에서 RX 5700 XT와 RX 5700의 가격이 공개되었습니다. 개인적인 기준과 기대에 비추어보면, 생각보다 아쉬운 가격으로 느껴집니다. 이미 그래픽카드 시장은 엔비디아의 지포스 RTX 시리즈가 출시된지 꽤 시간이 흐른 시점이고, 심지어 튜링 리프레시 제품들에 대한 루머가 흘러 나오는 예측불가의 상황이기 때문이죠. 특히 공식 슬라이드에서 2019년 1월에 출시된 $349의 RTX 2060과 비교하며, 좀 더 성능이 좋다고 내세운 RX 5700이 $379로 발표되었는데, 늦게 출시된 제품이 더 높은 가격으로 책정되면, 성능의 우수함은 당연히 갖춰야 하는 것이고, 성능 차이가 제법 커야 경쟁력과 상품성이 돋보이게 됩니다. 현시점에서 공개된 성능 정보를 토대로 가격을 바라봤을 때 애매하게 느껴지는 이유가 여기에 있습니다. 좀 더 공격적인 가격 정책이었다면 좋았을 텐데... 아쉬운 마음이 떠나질 않는군요. 또한, 라데온 RX 5700 XT의 경우 경쟁 상대로 꼽은 RTX 2070 가격보다 저렴한 것은 맞지만, 이 역시 향후 엔비디아의 행보에 따라 평가가 달라질 수 있다는 변수가 있습니다. 어쨌든, AMD 측에서 제공한 성능 자료만 있는 상황이고 실제로 제품 출시와 함께 세부적인 성능 검증을 실시하기 전까지는 정확한 구체적인 평가를 보류하도록 하겠습니다. AMD 라데온 RX 5700 XT 50주년 에디션 공개
그리고, 리사 수 박사(Dr. Lisa Su)가 직접 라데온 RX 5700 XT의 특별판에 해당하는 50주년 에디션을 소개하였습니다. 일반 버전보다 더 높은 클록 주파수, 금색 하우징이 가미된 특별한 쿨러가 적용되었군요. 고급스러운 외형이 돋보입니다. 가격은 $50이 더 비싼 $499로 확인되었습니다. ※ 미국 LA 현지에서 퀘이사존지름님이 직접 촬영하여 보내온 라데온 RX 5700 XT 레퍼런스 그래픽카드 실물을 공개합니다. 라데온 RX 5700 XT는 RX 5700과 겉으로 드러나는 디자인에는 다소 차이가 있으나 내부적으로는 동일한 쿨링 시스템을 사용하고 있습니다. AMD 본사의 설명으로는 외형적으로 차이를 만들고 싶었다고 하는군요.
|