•  


[리뷰] 이름은 獨特해도 性能은 確實하다, AMD 라데온 RX 7900 GRE

[리뷰] 이름은 獨特해도 性能은 確實하다, AMD 라데온 RX 7900 GRE

AMD 라데온 RX 7900 GRE. / 출처=IT동아
AMD 라데온 RX 7900 GRE. / 出處=IT東亞

[IT東亞 강형석 記者] 데스크톱 그래픽카드 市場의 話頭는 斷然 ‘게이밍(Gaming)’과 ‘人工知能(AI)’이다. 家庭 內에서 게임을 즐기는 것 外에도 人工知能 關聯 機能을 經驗할 수 있게 되면서 떠오른 單語다. 特히 人工知能 關聯 機能은 單純히 코딩을 하고 專門 演算을 遂行하는 水準이 아니라 自然스레 우리 日常 속에 뿌리내리는 中이다. 動映像 畫質을 改善해 준다거나 게임을 더 快適하게 즐길 수 있도록 도와주는 作業 等이 代表的인 事例다.

이런 部分에서 사실 AMD는 頭角을 드러내지 못한 것이 事實이다. 그러나 다양한 支援과 努力을 앞세워 差異를 克服해 나가는 中이다. 게이밍에서는 FSR 3.0을 始作으로 人工知能 分野에서는 ROCm, 다이렉트-머신러닝(ML), 모자익-머신러닝(ML) 等을 支援하며 着實히 準備하는 모습이다. 改善은 더 必要하지만, 時間이 解決해 줄 部分이다.

製品群도 忠實히 채워지고 있다. RX 7900 XTX와 XT에 머물러 있던 것에서 現在는 入門型이라 할 수 있는 RX 7600부터 中上級人 RX 7800 XT까지 選擇 可能하다. 다만 上級 製品과 中上級 사이의 隔差가 多少 큰 便이었다. 實際로 RX 7900 XTX는 스트림 프로세서 수가 6,144個에 達하지만, RX 7900 XT는 5,376個, RX 7800 XT는 3,840個로 急激히 낮아진다. 이 사이의 間隙을 메워줄 그래픽카드의 存在가 必要한 셈이다.

엔비디아는 이를 成功的으로 마무리한 事例다. 지포스 RTX 4080, 4070 Ti, 4070에 各各 슈퍼(Super) 製品群을 追加하면서 촘촘한 選擇肢를 構成했다. AMD 또한 이에 對應하기 위해서는 適切한 製品을 配置할 必要가 있다. 그 그래픽카드가 바로 라데온 RX 7900 GRE다.

RX 7900 XT와 RX 7800 XT 사이 그 어딘가

라데온 RX 7900 GRE, 그동안 XT 或은 XTX라는 이름을 使用한 라데온에게 生疏한 이름이다. GRE는 Golden Rabbit Edition의 줄임말이라고 알려져 있다. ‘黃金토끼 特別版’ 程度로 보면 된다. 올해는 龍의 해라면 토끼는 지난 2023年을 意味한다. 이를 통해 完全히 새로 設計된 그래픽카드는 아님을 알 수 있다.

實際 그래픽 프로세서도 RDNA 3 設計를 따른다. 코드名 나비(Navi) 31로 5 nm(나노미터) 公正의 그래픽 코어(GCD)와 6nm 公正의 메모리 캐시(MCD)를 構成해 만들었다. 이른바 칩렛(Chiplet) 設計다. 스트림 프로세서의 數는 5,120個로 컴퓨팅 유닛 80個가 된다. 追加로 光線 加速 유닛 80個, 人工知能 加速器 160個 等이 게이밍 및 人工知能 加速에 힘을 보탠다.

AMD 라데온 RX 7900 GRE는 RX 7900 XT와 RX 7800 XT 사이의 간극을 메우는데 초점이 맞춰져 있다. / 출처=IT동아
AMD 라데온 RX 7900 GRE는 RX 7900 XT와 RX 7800 XT 사이의 間隙을 메우는데 焦點이 맞춰져 있다. / 出處=IT東亞

基本 作動速度는 1,270 MHz(메가헤르츠), 最大 2,245MHz까지 上昇한다. 別個로 게이밍 作動速度는 1,880MHz로 맞춰진다. 이 數値는 모두 라데온 RX 7900 XTX(1,900~2500MHz / 2,300MHz)와 7900 XT(1,500~2400MHz / 2,000MHz) 對比 낮다.

메모리 構成과 速度도 上位 製品 對備 調整이 이뤄졌다. 메모리 構成은 384비트(RX 7900 XTX)와 320비트(RX 7900 XT)에서 256비트가 되었다. 容量은 16GB로 여느 그래픽카드와 다를 바 없는 數値인데 24GB, 20GB 構成에 比하면 아쉬움이 느껴진다. 勿論, 지포스 RTX 4070 系列 그래픽카드가 192비트 構成과 12GB 容量을 提供하는 것과 比較하면 充分히 競爭 可能한 部分이다. 速度는 2,250MHz(18Gbps) 辭讓이다.

AMD 라데온 RX 7900 GRE. / 출처=IT동아
AMD 라데온 RX 7900 GRE. / 出處=IT東亞

整理하자면 라데온 RX 7900 GRE는 中級기와 上級機 사이의 間隙을 메워주는 役割에 忠實하다. 過去 이런 境遇에는 製品 性向이 極端的으로 드러났다. 下剋上을 벌일 程度의 宏壯한 物件이 되거나 記憶 속에서 잊히는 物件이 되는 式이다. 最近에는 戰略的인 目的으로 不足한 製品群의 間隙을 메우거나 競爭을 위해 背馳되는 일이 많다. 따라서 性能이나 價格的인 部分을 徹底히 考慮해 仕樣이 定해진다.

RX 7900 이름 아깝지 않은 快適한 게이밍 性能

이제야 人工知能 演算에 對한 그래픽 프로세서의 重要性이 擡頭되고 있지만, 게이밍 性能에 對한 期待感도 지울 수 없다. 라데온 RX 7900 GRE의 게이밍 性能은 어느 程度일까? XT까지는 아니더라도 7900이라는 數字를 달고 있기 때문에 期待가 되는 部分이다. 性能 測定은 AMD 라이젠 9 7950X 基盤 PC 시스템에서 進行됐다.

AMD 라데온 RX 7900 GRE의 3D마크 파이어 스트라이크 익스트림 측정 결과. / 출처=IT동아
AMD 라데온 RX 7900 GRE의 3D마크 파이어 스트라이크 익스트림 測定 結果. / 出處=IT東亞

먼저 3D마크 파이어 스트라이크 익스트림 性能 測定 結果를 살펴보자. 그래픽 項目에서 2萬 7,991點을 記錄했다. 細部 內容을 보면 綜合 테스트에서 秒當 64.27 프레임을 記錄한 것을 包含해 그래픽 測定 項目 2個 모두 104~146 프레임 사이를 記錄했다. 最新 命令語는 아니지만, 4K 解像度 驅動에 焦點을 두고 性能 測定이 이뤄지기 때문에 높은 프레임을 具現한 點은 印象的이다.

AMD 라데온 RX 7900 GRE의 3D마크 타임 스파이 익스트림 측정 결과. / 출처=IT동아
AMD 라데온 RX 7900 GRE의 3D마크 타임 스파이 익스트림 測定 結果. / 出處=IT東亞

3D마크 타임 스파이 性能 測定 結果는 그래픽 基準으로 2萬 2,038點이다. 두 가지 그래픽 處理 性能 測定 項目에서 125~144 프레임을 記錄했다. 이 테스트는 光源追跡까지는 아니더라도 比較的 最新 그래픽 處理 命令語를 使用한다. 4K까지는 무리더라도 풀HD 或은 QHD(2,560 x 1,440) 水準의 解像度 아래에서는 快適한 게이밍 經驗이 可能할 것으로 豫想된다.

AMD 라데온 RX 7900 GRE로 사이버펑크 2077(레이 트레이싱 : 울트라 설정)을 구동한 결과 80.39 프레임을 기록했다. / 출처=IT동아
AMD 라데온 RX 7900 GRE로 사이버펑크 2077(레이 트레이싱 : 울트라 설정)을 驅動한 結果 80.39 프레임을 記錄했다. / 出處=IT東亞

게임 性能을 測定하기 위해 사이버펑크 2077을 實行했다. 解像度는 풀HD(1,920 x 1,080)에 게임 내 그래픽 設定은 레이 트레이싱 : 울트라를 一括 適用했다. 라데온 RX 7900 GRE 基本 機能을 經驗하기 自動 設定되는 項目 外에는 修正을 加하지 않았다. 內部 性能 測定(벤치마크)을 實行해 본 結果 平均 80.39 프레임을 記錄했다. QHD 解像度 內에서는 秒當 60 프레임 前後를 記錄할 것으로 豫想된다.

AMD 그래픽 드라이버 내에 있는 성능 향상 기능을 활용하면 조금 더 쾌적한 게이밍 경험이 가능하다. 실제 기능을 사용하니 같은 설정의 사이버펑크 2077에서 초당 4프레임이 향상됐다. / 출처=IT동아
AMD 그래픽 드라이버 內에 있는 性能 向上 機能을 活用하면 조금 더 快適한 게이밍 經驗이 可能하다. 實際 機能을 使用하니 같은 設定의 사이버펑크 2077에서 秒當 4프레임이 向上됐다. / 出處=IT東亞

다음으로 AMD의 知能型 技術을 活性化한 結果를 보자. AMD 그래픽카드 드라이버 內에는 性能과 品質을 높일 수 있는 設定들이 提供된다. 그中 HYPR-RX는 라데온 高解像度(RSR)부터 프레임 補正(FSR) 等을 一括 適用하거나 部分 適用하는 等의 便宜性을 갖췄다. 基本 設定을 통해 최정 性能이 어느 程度 向上되는지 確認했다.

同一한 設定의 사이버펑크 2077에서 確認해 보니 平均 84.01 프레임을 記錄했다. 高仕樣 光源處理 效果와 더불어 그래픽 品質까지 最高인 狀態에서 조금 더 快適한 게이밍 經驗이 可能한 點이 印象的이다. 解像度가 높다면 이 같은 機能이 도움이 된다. 異質感이 들 때도 있지만, 瞬間 지나가기 때문에 익숙해지면 큰 問題없을 듯하다.

上級 製品 對備 不足함 느껴지지 않는 人工知能 性能

라데온 RX 7900 GRE의 人工知能 處理 性能은 어느 程度일까? UL Solutions(유엘 솔루션즈)의 性能 測定 소프트웨어인 Procyon(프로키온)을 活用해 實力을 確認해 봤다. 多樣한 測定 目錄 中 人工知能 推論(AI Inference benchmark for Windows)을 選擇했다. 性能은 各 環境에 따라 다를 수 있다는 點 알려둔다. 該當 테스트는 反精密度(FP16), 單精密度(FP32), 精髓(Integer) 項目이 있으므로 各各 進行한 結果를 살펴볼 것이다.

人工知能 推論 測定은 總 6가지로 이뤄져 있다. MobileNet(모바일넷) V3는 모바일 裝置에 맞는 簡單한 테스트로 이뤄진다. 이미지를 判別하는 過程이 主를 이룬다. RasNet(라즈넷) 50은 深層 訓鍊網 訓鍊을 바탕으로 이미지를 推論하는 것을 確認한다. 인셉션(Inception) V4는 조금 더 큰 이미지 分類를 위한 作業에 맞춰져 있다. DeepLab(딥랩) V3는 同一한 客體軍에 屬하는 이미지 픽셀을 竝列 連結하는데 所要되는 時間을 본다. YOLO(욜로) V3는 이미지 속 客體의 位置를 얼마나 빨리 찾는지를 判斷하며 Real-ESRGAN은 업스케일링 合成 데이터 處理가 얼마나 빨리 이뤄지는지를 確認한다.

UL 프로키온 인공지능 추론 테스트(반정밀도) 결과를 쉽게 볼 수 있도록 정리한 것. 좌측이 라데온 RX 7900 XTX, 우측이 RX 7900 GRE의 결과값이다. / 출처=IT동아
UL 프로키온 人工知能 推論 테스트(反精密度) 結果를 쉽게 볼 수 있도록 整理한 것. 左側이 라데온 RX 7900 XTX, 右側이 RX 7900 GRE의 結果값이다. / 出處=IT東亞

먼저 라데온 RX 7900 XTX의 性能을 測定했다. 反精密度(Half-Precision)라 부르는 FP16 項目을 選擇해 進行했다. 그 結果 MobileNet V3 項目은 平均 0.6ms(推論 수 18萬 9,346)가 所要됐다. RasNet 50 項目은 1.2ms(推論 수 12萬 9,362), Inception V4는 6.82ms(推論 수 2萬 2,696), DeepLab V3는 11.84ms(推論 數 1萬 1,710), YOLO V3는 4.58ms(推論 수 2萬 7,708), Real-ESRGAN 項目에서는 45.99ms(推論 수 3,867)를 記錄했다.

이제 RX 7900 GRE의 性能을 確認해 볼 次例다. MobileNet V3 項目은 平均 0.56ms(推論 수 19萬 6,901)로 僅少하게 빠른 處理 能力을 보여준다. RasNet 50 項目은 1.35ms(推論 수 11萬 6,054), Inception V4는 6.92ms(推論 수 2萬 1,918)로 若干 뒤처졌으나 DeepLab V3는 9.59ms(推論 數 1萬 3,451), YOLO V3는 4.41ms(推論 수 2萬 6,745)로 다시 앞서기도 했다. Real-ESRGAN 項目에서는 59.22ms(推論 수 3,015)를 記錄했다.

UL 프로키온 인공지능 추론 테스트(단정밀도) 결과를 쉽게 볼 수 있도록 정리한 것. 좌측이 라데온 RX 7900 XTX, 우측이 RX 7900 GRE의 결과값이다. / 출처=IT동아
UL 프로키온 人工知能 推論 테스트(單精密度) 結果를 쉽게 볼 수 있도록 整理한 것. 左側이 라데온 RX 7900 XTX, 右側이 RX 7900 GRE의 結果값이다. / 出處=IT東亞

單精密度(Single-Precision) 測定 項目에서는 어떤 結果가 나왔을까? MobileNet V3 項目에서는 平均 0.53ms(推論 수 22萬 4,934)가 所要된 것을 始作으로 RasNet 50 項目은 1.78ms(推論 수 9萬 263)에 作業을 마쳤다. Inception V4는 6.38ms(推論 수 2萬 4,100), DeepLab V3는 9.77ms(推論 數 1萬 3,461), YOLO V3는 4.48ms(推論 수 2萬 8,023), Real-ESRGAN 項目에서는 69.3ms(推論 수 2,580)를 各各 記錄했다.

라데온 RX 7900 GRE는 어느 程度 性能인지 살펴보자. MobileNet V3 項目은 平均 0.46ms(推論 수 27萬 7,337)로 小幅 若干 좋은 모습을 보여줬다. 이어 RasNet 50 項目 1.83ms(推論 수 8萬 8,519), Inception V4는 6.74ms(推論 수 2萬 2,402)이라는 數値가 나왔다. DeepLab V3는 8.52ms(推論 數 1萬 4,885), YOLO V3 5.51ms(推論 수 2萬 2,922), Real-ESRGAN 項目에서는 96.91ms(推論 수 1.848)를 記錄했다.

UL 프로키온 인공지능 추론 테스트(정수) 결과를 쉽게 볼 수 있도록 정리한 것. 좌측이 라데온 RX 7900 XTX, 우측이 RX 7900 GRE의 결과값이다. / 출처=IT동아
UL 프로키온 人工知能 推論 테스트(整數) 結果를 쉽게 볼 수 있도록 整理한 것. 左側이 라데온 RX 7900 XTX, 右側이 RX 7900 GRE의 結果값이다. / 出處=IT東亞

精髓(Integer)에서의 測定 結果를 보자. 라데온 RX 7900 XTX의 MobileNet V3 項目은 平均 2.11ms(推論 수 7萬 1,406)가 所要되었고 RasNet 50 項目 1.37ms(推論 수 10萬 2,515), Inception V4는 3.4ms(推論 數 3萬 9,228)가 所要됐다. DeepLab V3는 65.06ms(推論 수 2,608), YOLO V3는 49.77ms(推論 수 3,411), Real-ESRGAN 項目에서는 150.88ms(推論 수 1,190)를 記錄했다.

라데온 RX 7900 GRE의 結果는 이보다 조금 뒤처진다. MobileNet V3 項目은 平均 2.62ms(推論 수 5萬 9,007)로 小幅 差異를 보인 것을 包含해 RasNet 50 項目 1.45ms(推論 수 10萬 2,831), Inception V4는 4.21ms(推論 數 3萬 2,787)이라는 數値가 나왔다. DeepLab V3는 65.78ms(推論 수 2,579), YOLO V3 38.83ms(推論 수 4,358), Real-ESRGAN 項目에서는 206.9ms(推論 수 868)를 記錄했다.

餘裕로운 性能과 完成度, 合理的 價格이라는 퍼즐까지 더해지길

製品을 부를 때 若干의 語塞함이 느껴지지만, 라데온 RX 7900 GRE의 存在 自體는 充分한 競爭力이 있다. 컴퓨트 유닛(스트림 프로세서) 構成만 놓고 보자면 아쉬울 수 있다. 代身 이 部分을 256비트/16GB 容量 構成의 메모리로 代身한다. 엔비디아가 그래픽카드 메모리 容量에 조금 인색한 모습을 보일 때 AMD는 製品에 따라 最適의 메모리 構成을 提案해 왔다. 이番에도 그 基調에는 變함이 없다.

상위 제품군 이름에 맞는 성능은 갖춘 상태, 이제 남은 것은 최적의 가격이다. / 출처=IT동아
上位 製品群 이름에 맞는 性能은 갖춘 狀態, 이제 남은 것은 最適의 價格이다. / 出處=IT東亞

關鍵은 價格이다. 아직 國內 價格이 確定되지 않은 狀態라 쉽게 斷定할 수 없고 AMD가 發表한 勸奬消費者價格(MSRP)은 549달러다. 流通社가 基準 換率과 流通 마진, 其他 附帶費用을 어떻게 設定하는가에 따라 달라진다. 餘裕롭게 달러當 1,350원으로 設定하고 其他 流通 마진 等을 考慮하면 國內 出市價格은 89萬 원臺 或은 90萬 원臺 中後半에 形成되지 않을까 豫想된다.

競爭 製品이 될 지포스 RTX 4070 슈퍼의 價格은 製品에 따라 90萬 원臺, RTX 4070 Ti 슈퍼는 120~140萬 원 사이에 形成되어 있다. 라데온 RX 7900 GRE는 이 中間이라 볼 수 있는데 國內 市場 狀況에 맞는 價格 設定을 위해 流通社들이 苦心하는 듯하다.

高性能 製品은 끌리는데 너무 비싸고, 中級 製品은 性能이 아쉽다고 느껴질 때가 있다. 요즘은 購買心理가 曖昧해지는 區間을 잘 파고들어야 成功 可能性이 높아진다. 라데온 RX 7900 GRE는 그 心理를 잘 理解한 그래픽카드가 아닐까 생각된다.

글 / IT東亞 강형석 (redbk@itdonga.com)

IT東亞 의 모든 콘텐츠(技士)는 Creative commons 著作者標示-非營利-變更禁止 라이선스 에 따라 利用할 수 있습니다.
意見은 IT東亞(게임東亞) 페이스북 에서 덧글 또는 메신저로 남겨주세요.
- "漢字路" 한글한자자동변환 서비스는 교육부 고전문헌국역지원사업의 지원으로 구축되었습니다.
- "漢字路" 한글한자자동변환 서비스는 전통문화연구회 "울산대학교한국어처리연구실 옥철영(IT융합전공)교수팀"에서 개발한 한글한자자동변환기를 바탕하여 지속적으로 공동 연구 개발하고 있는 서비스입니다.
- 현재 고유명사(인명, 지명등)을 비롯한 여러 변환오류가 있으며 이를 해결하고자 많은 연구 개발을 진행하고자 하고 있습니다. 이를 인지하시고 다른 곳에서 인용시 한자 변환 결과를 한번 더 검토하시고 사용해 주시기 바랍니다.
- 변환오류 및 건의,문의사항은 juntong@juntong.or.kr로 메일로 보내주시면 감사하겠습니다. .
Copyright ⓒ 2020 By '전통문화연구회(傳統文化硏究會)' All Rights reserved.
 한국   대만   중국   일본