もっと詳しく
このサイトは、このページのリンクからアフィリエイトコミッションを獲得する場合があります。 利用規約

驚くほど特定するのは難しい まさに AppleのM1とIntelのx86プロセッサの比較。 チップファミリは多くの一般的な消費者向けアプリケーションで広くレビューされていますが、macOSとWindowsの不可避の違い、エミュレーションの影響、x86とM1の最適化の程度の違いにより、正確な測定がより困難になっています。

興味深い新しいベンチマーク結果と 付随するレビュー アプリ開発者兼エンジニアのCraigHunterは、M1Ultraがフィールド上のすべてのIntelx86CPUを完全に破壊していることを示しています。 それは公正な戦いでさえありません。 Hunterの結果によると、6つのスレッドを実行するM1 Ultraは、2019年の28コアXeonワークステーションのパフォーマンスと一致します。

それが印象的です。

グラフのy軸をデータを収容するのに十分な高さまで拡張すると、M1 Ultraが6つのコアを超えると、突然の原因不明のスケーリングの災害に見舞われることを期待しています。

そして、それはx86では実際には良くなりません。 少なくともM1のスケーリング この時点で曲がります。

これはM1にとって大きな勝利です。 Appleの新しいCPUは、28コアのMacProの最高の結果よりも2倍以上高速です。 しかし、テスト自体について何を知っていますか?

ハンターベンチマークUSM3Dについて説明します NASAによる 「空力問題を解決するために産業界、政府、および学界で広く使用されるようになった四面体の非構造化フローソルバーとして。 USM3Dは、1989年の最初の導入以来、非粘性オイラーソルバーから完全な粘性ナビエ-ストークスコードへと着実に進化してきました。」

前述のように、これは計算流体力学テストであり、CFDテストはメモリ帯域幅に敏感なことで有名です。 ExtremeTechでUSM3Dをテストしたことはなく、これは私が精通しているアプリケーションではないため、テスト自体と、プラットフォームごとにどのようにコンパイルしたかについて、ハンターに連絡しました。 高度なマトリックス拡張機能またはIntelプラットフォームでは機能しなかった別の不特定の最適化のおかげで、M1Ultraがこれらのパフォーマンスレベルに達したという憶測がオンラインでありました。

ハンターによると、それは真実ではありません。

「M1でUSM3Dをコンパイルするとき、またはAccelerateまたはAMXのコードを調整または最適化しようとしたときに、Appleフレームワークにリンクしませんでした」とエンジニアおよびアプリ開発者は述べています。 「私はgfortranでストックUSM3Dソースを使用し、-O3最適化でかなり標準的なコンパイルを行いました。」

「正直なところ、これによりM1USM3D実行可能ファイルがIntelUSM3D実行可能ファイルよりもわずかに不利になると思います」と彼は続けました。 「私はIntelFortranコンパイラーを30年以上使用しており(IntelFortranになる前はDECFortran、次にCompaq Fortranでした)、それを最大限に活用する方法を知っています。 Intelコンパイラは、USM3Dをコンパイルするときに、積極的なベクトル化と最適化を行います。これまで、x86-64ではgfortranよりも優れたパフォーマンスを提供してきました。 そのため、M1にgfortranを使用することで、ある程度のパフォーマンスをテーブルに残したと思います。」

ハンターに、さまざまなIntelシステムと比較したM1Ultraのパフォーマンスについて説明したと感じたことを尋ねました。 エンジニアは、MacProやMacStudioなどのデスクトップシステムから実際のスーパーコンピューターに至るまで、さまざまなプラットフォームでCFDのパフォーマンスを評価してきた数十年の経験があります。

「過去と現在のすべてのテストに基づくと、ここでAppleシリコンマシンとの最大の違いを生み出しているのはSoCアーキテクチャであると感じています。計算にコアを追加するにつれて、システム帯域幅がパフォーマンススケーリング。 スタジオのM1Ultraには、非常に多くのシステム帯域幅があります。」

ベンチマークは、NASA USM3D CFDコードに基づいています。このコードは、米国市民が software.nasa.gov。 これはソースコードとして提供され、Fortranコンパイラでコンパイルする必要があります(一致するコンパイラサポートを使用してOpenMPIをビルドする必要もあります)。 makefileは、Intel Fortranコンパイラを使用してmacOSまたはLinux用にセットアップされます。これにより、x86-64用に高度に最適化された実行可能ファイルが作成されます。 gfortran(私がarm-64 Apple M1システムに使用したもの)を使用することもできますが、パフォーマンスはifortがx86-64で有効にできるものよりも低いと思います。」

これらの結果がx86/M1マッチアップについて何を言っているか

以前のCPUよりも多くのメモリ帯域幅を備えたSoCが、帯域幅に制約のある環境で良好に機能することは、まったく驚くべきことではありません。 これらの結果について興味深いのは、 しないでください 必然的に、ARMとx86の特定の側面に依存します。 AMDまたはIntelCPUに、Appleがここで取り組んでいるのと同じだけのメモリ帯域幅を与えると、パフォーマンスが同様に向上する可能性があります。

私の記事「RISCとCISCは最新のx86、ARM CPUを比較するための間違ったレンズです」では、x86が本質的に最高の命令セットアーキテクチャであったためではなく、アレイを活用できるため、Intelが数十年前にISA戦争に勝った方法について議論しました。 x86を世代から世代へと繰り返し改善しながら、継続的な製造の改善を実現します。 ここでは、Appleがほぼ間違いなく同様のことをしているのがわかります。 M1 Ultraは、すべてのIntel x86 CPUを破壊しているわけではありません。これは、魔法のようですが、Appleが行った方法でDRAMをパッケージに統合することで、パフォーマンスが大幅に向上したためです。 x86CPUがこれらの利点を利用できない理由はありません。 このベンチマークがメモリ帯域幅に制限されているという事実は、トップエンドのAlderLakeシステムが28コアのMacProなどの古いXeonに匹敵するか、それを超える可能性があることを示唆していますが、SoCとメインメモリ。

実際、x86 CPUは、より高速なメモリをパッケージに直接統合するための小さな一歩を踏み出しましたが、Intelは、Sapphire RapidsとそのオンパッケージHBM2メモリ(一部の将来のSKUで利用可能)を使用して、このテクノロジーをサーバーに集中させ続けています。 )。 IntelもAMDもM1Ultraのようなものを構築していませんが、少なくともまだです。 これまでのところ、AMDはオンパッケージDRAMに移行するのではなく、より大きなL3キャッシュの統合に重点を置いてきました。 このような動きには、OEMやPC製造分野の他の複数のプレーヤーからの賛同が必要になります。

Appleがテクノロジーを使用しているという理由だけで、どちらのx86メーカーもテクノロジーを急いで採用することはないと思いますが、M1は特定のテストで、ワットあたりの優れたパフォーマンスで、並外れたパフォーマンスを発揮します。 クパチーノ社の製造と設計へのアプローチのあらゆる側面が、AMDとIntelの(おそらく文字通りの)顕微鏡下に置かれていることは間違いありません。 これは特に、特定のISAや製造技術に結び付けられていない利益に当てはまります。

今読む

The post Apple M1 Ultraは、計算流体力学のパフォーマンスでIntelを粉砕します appeared first on Gamingsym Japan.