date
slug
status
tags
summary
type
MI300X vs H100 vs H200 Benchmark Part 1: Training – CUDA Moat Still Alive 通过 benchmarking,对比了 MI300X 和 H100/200 的性能

Key Takeaway

Key Findings

  1. On paper FLOPS 不可靠,靠 benchmark 才能说服人
  1. NVIDIA 的 out of box experience 远好于 AMD,这是由于 software stack 的质量差异带来的
  1. software stack 可能阻碍 user 发挥硬件的性能潜力
  1. software stack 的 user experience 很重要

Miscellany

  • GEMM 是现代深度学习最重要的 benchmark 对象之一
  • NVIDIA 高效的网络拓扑 nvlink 也是其 gpu 高性能的关键之一
notion image
Deep Learning Performance BackgroundAn Architecture Overview of ML Systems
Loading...