次世代NVIDIA GeForce RTX 4090は、AD102 GPUを搭載し、100 TFLOPsを突破する最初のゲーミング・グラフィックスカードとなる可能性があります。

次世代NVIDIA GeForce RTX 4090シリーズに関する最近の噂では、AD102を搭載したグラフィックカードが100TFLOPsの壁を突破する最初のゲーミング製品になるかもしれないとのことです。

NVIDIA GeForce RTX 4090クラスのグラフィックスカードは、100TFLOPsの壁を突破する最初のゲーミング「AD102」GPUとなるかもしれない。

現在、NVIDIA GeForce RTX 3090 Tiは、すべてのゲーミンググラフィックスカードの中で最高の演算性能を発揮し、FP32（単精度）GPU演算で40～45 TFLOPsを記録しています。

しかし、今年後半に登場する次世代GPUによって、状況は大きく前進することになります。

To be honest, I don't have much information about AMD. Maybe Lisa and Jensen's competition will give us a 100TFLOPS gaming war in a few months.

— kopite7kimi (@kopite7kimi) April 29, 2022

I can only say that the two products have improved a lot compared to their predecessors, but if you want to ask me directly which one is better, I'm sorry I can't answer, because no one knows the specific improvement by percentage.

— Greymon55 (@greymon55) April 30, 2022

Kopite7kimiとGreymon55の噂によると、NVIDIAだけでなくAMDの次世代グラフィックスカードも100TFLOPsの大台に乗ると予想されているそうです。

これは、現世代のカードで大きな性能と消費電力のジャンプを見てきたコンシューマグラフィックス市場で、大きなマイルストーンとなることでしょう。

275Wが限界だったのが、350～400Wが標準になり、RTX 3090 Tiのような製品はすでに500Wを超える電力を消費しているのです。

次世代はさらに電力を消費するようになりますが、もし演算の数字が何かであれば、なぜそれだけの電力を消費するのか、その理由はすでに1つわかっているはずです。

このレポートの通り、NVIDIAのAda Lovelace GPU、特にAD102チップは、TSMCの4Nプロセスノードでいくつかの大きなブレークスルーを見せている。

以前の2.2～2.4GHzのクロックの噂と比べると、現在の推定では、AMDとNVIDIAのブースト速度は互いに似ており、2.8～3.0GHz程度になると見られる。

NVIDIAの場合は、合計18,432個のコアと96MBのL2キャッシュ、384-bitのバスインターフェイスを融合させる予定だ。

これを12GPCのダイレイアウトで、6TPC、1TPCあたり2SMの合計144SMを積層する。

2.8GHzの理論クロックに基づくと、最大103TFLOPsの演算性能が得られ、噂ではさらに高いブーストクロックが示唆されています。

これは、AMDのピーク周波数が平均的な「ゲーム」クロックよりも高いのと同様、ピーククロックのように聞こえるのは間違いない。

100TFLOPs以上の演算性能は、3090 Tiフラッグシップに対して2倍以上の馬力を意味する。

しかし、演算性能は必ずしもゲーム全体の性能を示すものではないことを念頭に置く必要がありますが、それにもかかわらず、ゲーミングPCにとっては大きなアップグレードとなり、現在の最速コンソールであるXboxシリーズXの8.5倍となるのです。

FP32演算性能比較

つまり、PCのハードウェア、特にグラフィックカードがより強力になることは間違いありませんが、そのパワーが次世代ゲーム、特にレイトレーシングや将来のグラフィック効果を備えた8Kタイトルを動かすために有効に活用されるのは素晴らしいことです。

AMD、Intel、NVIDIAの次期フラッグシップGPUのスペック（暫定版）

GPU名	AD102	Navi 31	Xe2-HPG
コードネーム	Ada Lovelace	RDNA 3	Battlemage
フラッグシップ	GeForce RTX 4090シリーズ	Radeon RX 7900 シリーズ	Arc B900 シリーズ
製造プロセス	TSMC 4N	TSMC 5nm+ TSMC 6nm	TSCM 5nm?
GPUパッケージ	モノリシック	MCD (マルチ・チップレット・ダイ)	MCM (マルチ・チップレット・モジュール)
GPUダイ	Mono x 1	2 x GCD + 4 x MCD + 1 x IOD	4タイル (tGPU)
GPUメガクラスタ	12 GPCs (グラフィック処理クラスタ)	6シェーダーエンジン	10レンダースライス
GPUスーパークラスター	72 TPC (テクスチャ処理クラスタ)	30 WGPs ( MCD毎) 60 WGPs (合計)	40 Xe-Cores (Tile毎) 160 Xe-コア (合計)
GPU クラスター	144 ストリームマルチプロセッサー (SM)	120 コンピュートユニット(CU) 240 コンピュートユニット (合計)	1280 Xe VE (Tile毎) 5120 Xe VE (合計)
コア数(ダイ毎)	18432 CUDA コア数	7680 SP ( GCD毎) 15360 SP (合計)	20480 ALUs (合計)
ピーククロック	~2.85 GHz	~3.0 GHz	不明
FP32演算性能	~105 TFLOPs	~92 TFLOPs	不明
メモリタイプ	GDDR6X	GDDR6	GDDR6?
メモリ容量	24 GB	32 GB	不明
メモリバス幅	384-bit	256-bit	不明
メモリ速度	~21 Gbps	~18 Gbps	不明
キャッシュサブシステム	96 MB L2 Cache	512 MB (Infinity Cache)	不明
TBP	~600W	~500W	不明
発売時期	2022Q4	2022Q4	2023

ソース：wccftech – Next-Gen NVIDIA GeForce RTX 4090 With Top AD102 GPU Could Be The First Gaming Graphics Card To Break Past 100 TFLOPs

解説：

RTX4090TiはFP32演算性能が100TFLOPS越えへ

これ、どうなのでしょう。

AmpereはFP32演算性能は高いですが、ゲーム性能はさほど高くありません。

FP32演算性能だけを比較して同列に語ることはできないと思うのですが・・・。

Ampereのゲーム性能がFP32演算性能の割に低い原因はハッキリしていませんが、メモリの帯域が足りてないならば、RTX4000シリーズからは64bitバスあたり16MBの大容量キャッシュを搭載しますから、大幅にゲーム性能が上がる可能性はあると思います。

ただし、一時期まことしやかに語られていた「ゲームエンジンが増えたCUDAコアを使えてない」のが原因ならば、ちょっと古いゲームになると性能が伸びないという可能性もあります。

※　この説は最新のゲームでもAmpereの問題はまだ解決されていないので、間違っていると私は思います。単純にメモリ帯域が足りないのではないかと思います。

そのため、RX7900XTにゲーム性能で勝てるかどうかと言うのは正直微妙だと思います。

RDNA2もさほどFP32演算性能は高くはありませんが、RX6900XTはRTX3080Tiとほぼ同レベルのゲーム性能を持っています。

恐らく、nVidiaはRX7900XTにFP32演算性能で勝てるようにギリギリまでAD102のフルシリコンをOCして出荷するのでしょう。

それが、900Wとも言われるRTX4090Tiの莫大な消費電力に繋がっていると思います。

一方で、ゲーム向けで初のMCMを採用するRX7900XTはチップ間リンクで発生する遅延をどのように解決するのかによって癖のあるGPUになる可能性もあります。

限界ギリギリまで回して無理矢理RX7900XTに勝とうとするRTX4090Tiが吉と出るのか凶と出るのかは今の段階ではまだわかりません。

しかし、900Wと言う消費電力を聞くと、初期ロットは怖いなあと思うのは私だけでしょうか。(苦笑

nVidia　RTX3000シリーズGPU

RTX3090

ASUS NVIDIA GeForce RTX 3090 搭載トリプルファンモデル 24G TUF-RTX3090-O24G-GAMING

created by Rinker

ASUSTek

¥294,800
(2022/05/01 18:41:14時点 Amazon調べ-詳細)

RTX3080Ti

ZOTAC GAMING GeForce RTX 3080 Ti Trinity グラフィックスボード ZT-A30810D-10P VD7694

created by Rinker

ZOTAC

¥209,800
(2022/05/02 03:29:29時点 Amazon調べ-詳細)

RTX3080 10GB LHR

ZOTAC GAMING GeForce RTX 3080 Trinity OC LHR グラフィックスボード ZT-A30800J-10PLHR VD7781

created by Rinker

ZOTAC

¥146,264
(2022/05/02 03:29:29時点 Amazon調べ-詳細)

RTX3070Ti

ASUS TUF Gaming NVIDIA® GeForce RTX

3070 Ti 搭載ビデオカード OC/ PCIe 4.0 / 8GB GDDR6X / HDMI 2.1 / DisplayPort 1.4a /デュアルボールファンベアリング, ミリタリーグレードのコンデンサ/ GPU Tweak II TUF-RTX3070TI-O8G-GAMING

created by Rinker

ASUSTek

¥107,000
(2022/05/02 02:00:29時点 Amazon調べ-詳細)

Geforce RTX3070 8GB GDDR6 LHR

ZOTAC GAMING GeForce RTX 3070 AMP Holo LHR グラフィックスカード 8GB GDDR6

created by Rinker

ZOTAC(ゾタック)

¥132,124
(2022/05/02 03:29:30時点 Amazon調べ-詳細)

ZOTAC GAMING GeForce RTX 3070 Twin Edge OC LHR グラフィックスカード 8GB GDDR6

created by Rinker

ZOTAC(ゾタック)

¥121,080
(2022/05/02 03:29:31時点 Amazon調べ-詳細)

RTX3060Ti 8GB GDDR6

ZOTAC GAMING GeForce RTX 3060 Ti Twin Edge OC LHR グラフィックスカード 8GB GDDR6

created by Rinker

ZOTAC(ゾタック)

RTX3060 12GB GDDR6

ZOTAC GeForce RTX 3060 Twin Edge OC グラフィックスボード ZT-A30600H-10M VD7558

created by Rinker

ZOTAC

¥66,800
(2022/05/01 10:13:54時点 Amazon調べ-詳細)

RTX2000シリーズ

RTX2060 12GB

RTX2060が12GBメモリを搭載して復刻

ZOTAC GAMING GeForce RTX 2060 Twin Fan グラフィックスカード 12GB GDDR6 ZT-T20620F-10M

created by Rinker

ZOTAC(ゾタック)

¥66,987
(2022/05/02 03:50:04時点 Amazon調べ-詳細)

nVidia Geforce RTX1600シリーズ

GTX1650SUPER

ASUS NVIDIA GeForce GTX 1650 SUPER 搭載デュアルファンモデル 4G TUF-GTX1650S-O4G-GAMING

created by Rinker

ASUS

¥41,900
(2022/05/02 03:50:05時点 Amazon調べ-詳細)

GTX1650 GDDR6

ZOTAC GeForce GTX 1650 OC グラフィックスボード ZT-T16520F-10L VD7269

created by Rinker

ZOTAC

¥32,380
(2022/05/02 03:29:31時点 Amazon調べ-詳細)

Gadget Gate

次世代NVIDIA GeForce RTX 4090は、AD102 GPUを搭載し、100 TFLOPsを突破する最初のゲーミング・グラフィックスカードとなる可能性があります。

Archives