もっと詳しく

NVIDIA GeForce RTX 4090 Ti & RTX 4090グラフィックスカードは、PCゲーム分野でこれまでにないパフォーマンスレベルをもたらす、グリーンチームの次世代フラッグシップとなりそうだ。

ここでは、スペック、価格、性能など、知っておくべきすべてを紹介する。

NVIDIA GeForce RTX 4090 Ti & RTX 4090 – 究極のゲーマーのための次世代BFGPU

[更新日-19/05/22】

NVIDIA GeForce RTX 3090シリーズは、PCグラフィックスセグメントでリードを確保するために、グリーンチームが極端な努力をすることができることを証明しました。

BFGPU」と名付けられた、新しいタイプのエンスージアストおよび究極のグラフィックスカードは、最高のパフォーマンスと最高のPCゲーミング機能を、他に類を見ないパッケージで提供します。

NVIDIAがBFGPUで目指したのは、究極のゲーマーのためだけでなく、最高のグラフィックス性能を手元に置いて、優れたビジュアルと狂気の流動性で次世代のAAAゲームタイトルを強化したいプロのコンテンツクリエーターのためのグラフィックスカードも設計することでした。

昨今、重要なのはFPSだけでなく、ビジュアルやよりスムーズなフレームレートであり、これこそGeForce RTX 3000シリーズが得意とするところです。

次世代フラッグシップでも同様のことを期待したいところですが、考慮すべき重要な要素は、GPUがよりパワフルになり、より高価になってきているということです。

これは、より良い製品を手に入れるために将来も続くかもしれない傾向ですが、その代わり、エンドユーザーには常にコストが発生します。

そこで、これまでに分かっていることから始めると、まず、次世代GeForce RTX 40シリーズカードに搭載される全く新しいAda LovelaceまたはAD10*クラスのGPUを見てみる必要があります。

NVIDIAのAD102「Ada Lovelace」GPU – 次世代パワーハウス

GPUの構成から始めて、Kopite7kimiはトップのAD102 GPUをグリーンチームの他の様々なGPUと比較しています。

ゲームに特化した「Ampere GA102」や「Turing TU102」、HPCに特化した「Hopper GH100」や「Ampere GA100」などが加えられている。

HPCに特化した設計は、コンシューマ向けの製品とは大きく異なるため、ここではAD102をゲーミング向けの製品と比較することにする。

GPUのサイズは約600mm2で、グリーンチーム向けに設計されたTSMCの5nm(N5)ノードの最適化バージョンであるTSMC 4Nプロセスノードを利用すると言われている。

NVIDIA Ada Lovelace AD102 GPUは、最大12 GPC (Graphics Processing Clusters)を搭載する予定です。

これは、GA102が7GPCしか搭載していないのに対し、70%増となる。各GPUは、6つのTPCと2つのSMで構成され、これは従来のチップと同じ構成です。

各SM(Streaming Multiprocessor)には4つのサブコアが搭載されますが、これもGA102 GPUと同じです。

変更点は、FP32とINT32のコア構成です。各サブコアには128個のFP32が搭載されるが、FP32+INT32を合わせると最大192個になる。

これは、FP32ユニットがIN32ユニットと同じサブコアを共有しないためだ。128個のFP32コアは、64個のINT32コアとは別になっている。

つまり、各サブコアは、128個のFP32ユニットと64個のINT32ユニットで構成され、合計で192個となる。

各SMは、FP32ユニット512個+INT32ユニット256個、合計768個を搭載することになる。

そして、SMは合計24基(GPCあたり2基)なので、FP32ユニット12,288基、INT32ユニット6,144基、合計18,432基のコアを持つことになる。

また、各SMには2つのWrap Schedules(32スレッド/CLK)が含まれ、SMあたり64ラップになります。

これはGA102 GPUと比較して、コア数(FP32+INT32)で50%、Wraps/Threadsで33%の増加となっています。

NVIDIA AD102「Ada Lovelace」Gaming GPU「SM」ブロック図(ソース:Kopite7kimi):

※ 画像をクリックすると別Window・タブで拡大します。

 

NVIDIA Ada Lovelace GPUのスペック「暫定版」:

GPU名 AD102 対GA102 対TU102 対GA100 対GH100
GPC 12 (GPU毎) 1.7x 2x 1.5x 1.5x
TPC 6 (GPC毎) 同じ 同じ 0.75x 0.67x
SM 2 (TPC毎) 同じ 同じ 同じ 同じ
Sub-Core 4 (SM毎) 同じ 同じ 同じ 同じ
FP32 128 (SM毎) 同じ 2x 2x 同じ
FP32+INT32 192 (SM毎) 1.5x 1.5x 1.5x 同じ
ワープ 64 (SM毎) 1.33x 2x 同じ 同じ
スレッド 2048 (SM毎) 1.33x 2x 同じ 同じ
L1キャッシュ 192 KB
(SM毎)
1.5x 2x 同じ 0.75x
L2キャッシュ 96 MB
(GPU毎)
16x 16x 2.4x 1.6x
ROP数 32 (GPC毎) 2x 2x 2x 2x

キャッシュに話を移すと、ここもNVIDIAが既存のAmpere GPUに対して大きなブーストをかけた部分である。

Ada Lovelace GPUは、SMあたり192KBのL1キャッシュを搭載し、Ampereから50%増となる。

これは、トップのAD102 GPUでは、合計4.5MBのL1キャッシュを搭載することになる。

L2キャッシュは、リークにあるように96MBに増量される。これは、6MBのL2キャッシュを搭載するAmpere GPUの16倍に相当する。

このキャッシュは、GPU全体で共有される。

最後に、ROPですが、これも1GPCあたり32個に増え、Ampereの2倍になっています。Ampereの最速GPUであるRTX 3090 Tiでは112個しかなかったROPが、次世代フラッグシップでは最大で384個になるわけです。

また、Ada Lovelace GPUには、最新の第4世代Tensorコアと第3世代RT(Raytracing)コアが搭載されており、DLSSとRaytracingのパフォーマンスを次のレベルに引き上げるのに役立ちます。

Ada Lovelace AD102 GPUは、全体として以下のような特徴を備えています。

  • 2倍速GPC(対Ampere比)
  • 50%増のコア数(対Ampere比)
  • 50%増のL1キャッシュ対Ampere比)
  • 16倍のL2キャッシュ(対Ampere比)
  • ダブルザROPs(対Ampere比)
  • 第4世代Tensorコアと第3世代RTコア

なお、2~3GHzとされるクロックは考慮されていないため、Ampereに対するコア単位の性能向上にも大きな役割を果たすことになる。

NVIDIA GeForce RTX 4000シリーズ グラフィックカードラインアップ(噂):

グラフィック
カード
GPU PCBモデル SMユニット
数 / コア数
メモリ容量
・バス幅
メモリ
クロック
帯域幅
TGP 補助電源
コネクタ
NVIDIA GeForce
RTX 4090 Ti
AD102-350? 不明 144 / 18432? 48 GB / 384-bit 24 Gbps /
1.15 TB/s
~600W 16-pin x1
NVIDIA GeForce
RTX 4090
AD102-300? PG137/139 SKU330 126 / 16128? 24 GB / 384-bit 21 Gbps /
1.00 TB/s
~450W 16-pin x1
NVIDIA GeForce
RTX 4080
AD103-300? 不明 >84 / 10752? 16 GB / 256-bit 21 Gbps /
672 GB/s
~350W 16-pin x1
NVIDIA GeForce
RTX 4070
AD104-400? PG141-310 SKU341 >60 / 7680 12 GB / 192-bit 18 Gbps /
432 GB/s
~300W 16-pin x1

NVIDIA GeForce RTX 4090 Ti & RTX 4090グラフィックスカードの仕様

NVIDIA GeForce RTX 4090 Ti & RTX 4090は、上記で詳細を説明したトップAD102 GPUを搭載した2チップのみとなる見込みです。

RTX 3090 TiとRTX 3090で見たように、どちらも同じチップの異なるSKUを搭載することになる。

NVIDIA GeForce RTX 4090 Tiの「予想される」スペック

NVIDIA GeForce RTX 4090 Tiは、144個のSMをすべて有効にしたフルファット構成で、合計18432個のCUDAコアが搭載される予定です。

96MBのL2キャッシュと合計384のROPsを搭載しており、まさに狂気の沙汰と言えるでしょう。

クロックはまだ確定していませんが、TSMC 4Nプロセスを採用していることから、2.0~3.0GHzのクロックが予想されます。

メモリのスペックについては、GeForce RTX 4090 Tiは、384-bitバスインターフェイスでより高速な24Gbpsの速度で来るかもしれない24GB GDDR6Xの容量が期待されています。

これは、最大1.152 TB/sの帯域幅を提供することになります。

このようにスペックが向上すると、消費電力も高くなり、このフラッグシップモデルは、約600WのTBPで動作すると予想されます。

600Wの場合、16ピンのGen 5コネクタ1つで十分ですが、AIBは必ずしも仕様内に収まらないため、ほとんどのカスタムモデルは間違いなくデュアルGen 5コネクタを利用することになるでしょうし、わずかなファクトリーオーバークロックでもTBPは600W以上になり、シングルGen 5電源コネクタの限界となります。

 

また、NVIDIA GeForce RTX 4090 Tiのヒートシンクとクーラーシュラウドの疑惑も確認されており、全体的に大きな構造とともにGPUとメモリダイの両方をカバーする、より頑丈なコールドプレートの使用をほのめかしています。

リークされたクーラーはFounders Editionのデザインで、その大きさから判断すると、AIBモデルは大幅に大きくなり、すべてのパートナーからクアッドスロットデザインが登場することになるかもしれませんね。

NVIDIA GeForce RTX 4090 Tiの「予想される」スペック

NVIDIA GeForce RTX 4090は、126個のSMを有効にして、合計16128個のCUDAコアを搭載したカットダウン構成になる予定だ。

GPUはL2キャッシュも少し削減されるかもしれないが、GPCの数が少ないため、ROP数は間違いなく少なくなるはずだ。

クロックについては、非Tiモデルは若干低下しますが、それでもRTX 3090 Tiに対して十分な速度になることが予想されます。

メモリに関しては、GeForce RTX 4090も24GBのGDDR6Xを搭載する見込みだが、384bitバスインターフェイスで21Gbpsの速度で動作する。

これにより、最大で1.008TB/sの帯域幅が得られることになる。

Tiモデルとの比較では、非Tiは既存のRTX 3090 Tiグラフィックスカードと同じ450Wとやや低下したTGPが搭載される予定だ。

GeForce RTX 4090グラフィックスカードのクーラーとPCBを設計する上で、RTX 3090 TiはAIBにとって学習曲線だったようです。

だから、私たちも似たようなクーラーを使うことになるかもしれません。

NVIDIA GeForce RTX 4090 TiとRTX 4090グラフィックスカードは、最新の第4世代テンソルコア、第3世代RTコア、最新のNVENCエンコーダ、NVCDECデコーダ、最新のAPIへのサポートなど、最新のNV機能セットをすべて搭載しています。

また、DLSS、Reflex、Broadcast、Resizable-BAR、Freestyle、Ansel、Highlights、Shadowplay、G-SYNCのサポートなど、最新のRTX機能をすべて搭載しています。

NVIDIA GeForce RTX 4090 Ti & RTX 4090「速報版」スペック:

グラフィック
カード名
NVIDIA GeForce
RTX 4090 Ti
NVIDIA GeForce
RTX 4090
NVIDIA GeForce
RTX 3090 Ti
NVIDIA GeForce
RTX 3090
GPU名 Ada Lovelace AD102-350? Ada Lovelace AD102-300? Ampere GA102-350 Ampere GA102-300
製造プロセス TSMC 4N TSMC 4N Samsung 8nm Samsung 8nm
ダイサイズ ~600mm2 ~600mm2 628.4mm2 628.4mm2
トランジスタ数 不明 不明 280億 280億
CUDAコア数 18432 16128 10752 10496
TMU数 / ROP数 不明 / 384 不明 / 384 336 / 112 328 / 112
Tensor / RT コア数 不明 / 不明 不明 / 不明 336 / 84 328 / 82
ベースクロック 不明 不明 1560 MHz 1400 MHz
ブーストクロック ~2800 MHz ~2600 MHz 1860 MHz 1700 MHz
FP32演算性能 ~103 TFLOPs ~90 TFLOPs 40 TFLOPs 36 TFLOPs
RT TFLOPs 不明 74 TFLOPs 69 TFLOPs
Tensor-TOPs 不明 不明 320 TOPs 285 TOPs
メモリ容量 24 GB GDDR6X 24 GB GDDR6X 24 GB GDDR6X 24 GB GDDR6X
メモリバス幅 384-bit 384-bit 384-bit 384-bit
メモリ速度 24.0 Gbps 21.0 Gbps 21.0 Gbps 19.5 Gbps
メモリ帯域幅 1152 GB/s 1008 GB/s 1008 GB/s 936 Gbps
TGP 600W 450W 450W 350W
価格 (希望小売価格 / FE) $1999 US? $1499 US? $1999 US $1499 US
発売時期 2022/07? 2022/07? 2022/03/29 2020/09/24

NVIDIA GeForce RTX 4090 Ti & RTX 4090グラフィックスカードの性能

これらのモンスターGPUの性能については、発売が少し先なので、ここでは理論上の数字しか使えませんが、わかっていることに基づいて、RTX 4090シリーズのカードは、100 TFLOPsの演算馬力の制限に達する最初のゲームカードとなるかもしれません。

あくまで比較のため:

  • NVIDIA GeForce RTX 4090 Ti:~103 TFLOPs (FP32) (2.8GHzクロックと仮定)
  • NVIDIA GeForce RTX 4090:~90TFLOPs(FP32)(2.8GHzクロックと場合)
  • NVIDIA GeForce RTX 3090 Ti:40TFLOPs(FP32)(1.86GHzブーストクロック)
  • NVIDIA GeForce RTX 3090:36TFLOPs(FP32)(1.69GHzブーストクロック)

2.8GHzの理論クロックに基づくと、最大103TFLOPsの演算性能が得られ、噂ではさらに高いブーストクロックが示唆されています。

これは、AMDのピーク周波数が平均的な「ゲーム」クロックよりも高いのと同様、ピーククロックのように聞こえるのは間違いない。100TFLOPs以上の演算性能は、3090 Tiフラッグシップに対して2倍以上の馬力を意味する。

しかし、演算性能は必ずしもゲーム全体の性能を示すものではないことを念頭に置く必要がありますが、それにもかかわらず、ゲーミングPCにとっては大きなアップグレードとなり、現在の最速コンソールであるXboxシリーズXの8.5倍となるのです。

FP32演算性能比較

これは、各グラフィックスカードが前モデルに対して2倍の演算性能の向上を実現することになり、それぞれの部門で大きな向上が期待されるRTとTensorコアの性能は考慮されていません。

FLOPは必ずしもグラフィックスやゲーム性能を反映するものではありませんが、比較のための指標にはなります。

RTX 3090 と RTX 3090 Ti に対して 2-2.5 倍のゲインがあれば、非常に破壊的であり、NVIDIA が自社のカードの電力制限を厳しくしている理由も納得がいくでしょう。

DLSSを使えば、NVIDIAがRTX 3090シリーズのBFGPUで実現しようとしている、8K解像度での60 FPSのプレイも可能になるかもしれません。

NVIDIA GeForce RTX 4090 TI & RTX 4090グラフィックスカードの価格と入手性

さて、価格についてですが、NVIDIA GeForce RTX 3090 Ti & RTX 3090グラフィックスカードは、間違いなく、これまでで最も高価なシングルチップGPUとなります。

それぞれ1999ドルと1499ドルからで、価格は超エンターテイナーとプロフェッショナルセグメントを対象としています。

今回も、非常に高い価格が予想されますし、あちこちで多少の価格変動があることも予想されます。

グリーンチームにとっては、今の価格を維持することが賢明であり、ばかばかしいかもしれませんが、性能が良ければ巨額の現金を支払う人々もいます。

RTX 4090 TiとRTX 4090の差は、今回もずっと大きいです。NVIDIAはRTX 3090 Tiから期待したほどの反響を得られなかったようで、このカードをGPUセグメントから完全に取り除く代わりに、Ti以外のバリエーションをもっとスペックダウンすることにした可能性があります。

スペックダウンによって、RTX 3090 & RTX 3090 TiよりもRTX 4090 & RTX 4090 Tiの方が性能差が大きくなるので、今の1桁の性能アップではなく、15~20%の性能アップのために上位バリエーションを手に入れるだけの価値はあるかもしれない。

NVIDIA GeForce RTX 40シリーズグラフィックスカードは、7月中旬の発売が噂されており、我々はRTX 4090 Tiの非常に冷却性能が高いシュラウドが先にリークしているのを見てきましたが、NVIDIAはまだ非Tiバージョンを最初にリリースし、RTX 4090 Tiバージョンがかなり後で市場に出回る可能性があります。

しかし、NVIDIAが次世代のごく初期にハイエンドSKUをリリースするのは、これが初めてではないだろう。

RTX 2080 Tiフラッグシップは、その前身であるGTX 1080 Tiが初期ラインアップの発売から数カ月後に登場したにもかかわらず、他のラインアップと一緒に発売されました。

RTX 3090は、RTX 30シリーズのカードの初期ラインナップと一緒に発売されましたが、3090 Tiは1年以上遅れて登場しました。

今回、NVIDIAは最初から全ファミリーを発売し、後に中間サイクルリフレッシュを行う可能性もあるが、それはまだわからない。

NVIDIA GeForce GPUのセグメント/ティア価格

グラフィック
セグメント
2014-2016 2016-2017 2017-2018 2018-2019 2019-2020 2020-2021 2021-2022
Titan
クラス
Titan X
(Maxwell)
Titan X
(Pascal)
Titan Xp
(Pascal)
Titan V
(Volta)
Titan RTX
(Turing)
GeForce
RTX 3090
GeForce
RTX 3090 Ti
GeForce
RTX 3090
価格 $999 US $1199 US $1199 US $2999 US $2499 US $1499 US $1999 US
$1499 US
ウルトラ
エンスージアスト
クラス
GeForce
GTX 980 Ti
GeForce
GTX 980 Ti
GeForce
GTX 1080 Ti
GeForce
RTX 2080 Ti
GeForce
RTX 2080 Ti
GeForce
RTX 3080 Ti
GeForce
RTX 3080 Ti
価格 $649 US $649 US $699 US $999 US $999 US $1199 US $1199 US
エンスージアスト
クラス
GeForce
GTX 980
GeForce
GTX 1080
GeForce
GTX 1080
GeForce
RTX 2080
GeForce RTX
2080 SUPER
GeForce RTX
3080 10 GB
GeForce RTX
3080 12 GB
価格 $549 US $549 US $549 US $699 US $699 US $699 US $999 US
ハイエンド
クラス
GeForce
GTX 970
GeForce
GTX 1070
GeForce
GTX 1070
GeForce
RTX 2070
GeForce RTX
2070 SUPER
GeForce RTX
3070 Ti
GeForce RTX
3070
GeForce RTX
3070 Ti 16 GB
価格 $329 US $379 US $379 US $499 US $499 US $599
$499
未確認
メインストリーム
クラス
GeForce
GTX 960
GeForce
GTX 1060
GeForce
GTX 1060
GeForce
GTX 1060
GeForce RTX
2060 SUPER
GeForce RTX
2060
GeForce GTX
1660 Ti
GeForce GTX
1660 SUPER
GeForce GTX
1660
GeForce RTX
3060 Ti
GeForce RTX
3060 12 GB
GeForce RTX
3060 Ti
GeForce RTX
3060 12 GB
価格 $199 US $249 US $249 US $249 US $399 US
$349 US
$279 US
$229 US
$219 US
$399 US
$329 US
$399 US
$329 US
エントリー
クラス
GTX 750 Ti
GTX 750
GTX 950 GTX 1050 Ti
GTX 1050
GTX 1050 Ti
GTX 1050
GTX 1650
SUPER
GTX 1650
GTX 1650
SUPER
GTX 1650
RTX 3050
価格 $149 US
$119 US
$149 US $139 US
$109 US
$139 US
$109 US
$159 US
$149 US
$159 US
$149 US
$249 US

ソース:wccftech – NVIDIA GeForce RTX 4090 Ti & RTX 4090 Graphics Card Specs, Performance, Price & Availability – Everything We Know So Far

 

 

 

解説:

発売間近に迫り、トーンダウンするRTX4090/Ti

少し前まで、RTX4090Tiが900W、RTX4090が600Wと言われていたTBPですが、どうもRTX4090Tiが600W、RTX4090が450Wにそれぞれトーンダウンしたようです。

もっとも、これは公式での話で、AIBのカスタムOCモデルに関してはその限りではありません。

特にRTX4090Tiは900Wまで達するかどうかわかりませんが、700Wくらいまでは普通に消費するモデルが出るのではないかと思っています。

 

価格に関して

価格に関しては、高くなると言われています。

仮にTBPが同じRTX3090TiとRTX4090が同じとすると、日本円で30万円前後となり、RTX4090Tiがそれ以上(40-50万円程度?)と、普通の人が気軽に買える価格ではなくなります。

私としては、AmpereのラインナップのRTX3080のように、RTX4080の価格が突然安くなってくれるのかどうかと言うのが気になります。

そうでなければ今回のAda Lovelaceは非常に購入しにくい価格になるということになります。

確かに素晴らしいのは理解できますが、コスト当たりの性能に置き換えるとさほどでもないということになろうかと思います。

それは実際の製品が出てから、各メディアがレビューすることになると思います。

 

発売時期、順番

元記事にもある通り、私はRTX4090/RTX4080がほぼ同時期で、RTX4090Tiは遅くなる(2022年末-2023年頭)と思っています。

理由はAD102の状態の良いシリコンをそこそこ貯めてから生産しないと初期の需要に対応できないと思うからです。

ダイサイズが600mm2を超えると言われていますので歩留まりもそれなりでしょう。

ただ、私の予想通りの価格(40-50万円)だとすると、それほど購入できる層が多いとも思えませんが・・・。

RTX4090の性能に近いRT4080Tiが予定されているのであれば出来るだけ早く出てほしいところです。

Lovelace世代を持って、普通の人が気軽に上位モデルを買える世代ではなくなるということになります。

数年後はみんな普通に内蔵GPUでゲームをしているかもしれませんね。

 

性能に関して

RTX4090Tiが103TFLOPS、RTX4090が90TFLOPSとFP32演算性能に関してはかなりの性能アップになります。

AMDのRadeon RX7900XTのトーンダウン後(12288SP)のFP32演算性能が70TFLOPS程度ですから、文句なくGeforceが性能面で勝つということになるでしょう。

RDNA2の時はインフィニティキャッシュが存在したため、FP32演算性能が低くてもゲーム性能は高かったのですが、Lovelaceもインフィニティキャッシュによく似た大容量のL2を搭載しますので、RDNA2とAmpereの時のような関係にはならないと私は考えています。

 

 

nVidia RTX3000シリーズGPU

RTX3090

 

RTX3080Ti

 

RTX3080 10GB LHR

 

RTX3070Ti

 

Geforce RTX3070 8GB GDDR6 LHR

created by Rinker
ZOTAC(ゾタック)
¥132,880
(2022/05/20 03:36:29時点 Amazon調べ-詳細)

created by Rinker
ZOTAC(ゾタック)
¥100,184
(2022/05/20 03:36:30時点 Amazon調べ-詳細)

 

RTX3060Ti 8GB GDDR6

 

RTX3060 12GB GDDR6

 

RTX2000シリーズ

RTX2060 12GB

RTX2060が12GBメモリを搭載して復刻

created by Rinker
ZOTAC(ゾタック)
¥55,980
(2022/05/20 03:58:26時点 Amazon調べ-詳細)

 

nVidia Geforce RTX1600シリーズ

GTX1650SUPER

 

GTX1650 GDDR6

 

 

Copyright © 2022 自作ユーザーが解説するゲーミングPCガイド All Rights Reserved.