AMD MI1000 Instinct Accelerator 7nm GPU Untuk HPC Resmi Diluncurkan Menawarkan 11,5 Teraflops Performa Floating Point Presisi Ganda Puncak

GPU pertama AMD berdasarkan Arsitektur CDNA, MI100 resmi. MI100 Instinct Accelerator GPU diklaim sebagai “GPU HPC tercepat di dunia” dengan 11,5 teraflops kinerja titik-mengambang presisi ganda puncak. GPU mengklaim mengemas unit komputasi dua kali lebih banyak dari generasi sebelumnya sambil tetap berada dalam batas daya 300 watt yang sama.

AMD hari ini mengumumkan yang baru Akselerator insting MI100. GPU didasarkan pada mesin CDNA yang sedikit berbeda dari Arsitektur RDNA yang mendukung Kartu Grafis Seri AMD Radeon RX 6000 terbaru. MI100 Instinct Accelerator menggantikan akselerator MI50 dan MI60 Instinct yang diluncurkan dua tahun lalu. Meskipun periode waktu antar generasi yang relatif kecil, Arsitektur GPU dan Mesin Compute yang baru memungkinkan GPU AMD untuk melampaui harapan.

AMD MI1000 Instinct Accelerator GPU 7nm Untuk Spesifikasi dan Fitur Industri HPC:

GPU MI100 adalah yang pertama menggabungkan arsitektur Compute DNA (CDNA) AMD. GPU memiliki 210 Unit Komputasi yang disusun dalam empat susunan. Arsitektur CDNA adalah lompatan evolusioner yang signifikan dibandingkan dengan arsitektur GCN dan termasuk mesin inti matriks baru yang meningkatkan throughput komputasi untuk format numerik yang berbeda.

AMD mengklaim bahwa teknologi inti matriks AMD yang baru memberikan MI100 kinerja titik mengambang setengah presisi puncak 7x lebih besar dibandingkan dengan MI50. Perusahaan mengklaim bahwa MI100 Instinct Accelerator menawarkan 46,1 teraflops peak single-precision matrix (FP32), 23,1 teraflops peak single-precision (FP32), 184,6 teraflops peak half-precision (FP16) kinerja floating-point, dan 92,3 teraflop puncak kinerja bfloat16 .

Itu MI100 juga mendapatkan Teknologi Infinity Fabric dari AMD yang diklaim menawarkan sekitar 2x bandwidth I/O puncak peer-to-peer melalui PCIe 4.0 dengan bandwidth agregat hingga 340 GB/dtk per kartu. Dalam penerapan di kehidupan nyata, GPU MI100 dapat dikonfigurasi dengan hingga dua kumpulan GPU quad terintegrasi, masing-masing menyediakan bandwidth I/O peer-to-peer hingga 552 Gbps.

Demikian pula, empat tumpukan memori HBM2 8GB menyediakan total memori HBM2 32GB pada setiap GPU MI100. Dengan Kecepatan Jam 1,2 GHz, memori menawarkan bandwidth memori 1,23 Tbps. Dukungan MI100 untuk teknologi PCIe Gen 4.0 memungkinkan bandwidth data transportasi teoritis puncak 64 Gbps antara CPU dan GPU.

Apakah GPU Akselerator AMD MI100 Lebih Baik Dari GPU NVIDIA A100?

Sebenarnya di atas kertas, GPU MI100 AMD tampak lebih baik daripada GPU NVIDIA A100 yang dinilai pada 9,7 teraflops dari kinerja teoritis puncak. Namun, pada kenyataannya, NIVIDIA A100 menawarkan kinerja yang lebih tinggi untuk menjalankan FP64 Linpack.

Arsitektur CDNA dan RDNA AMD pada dasarnya sama dengan perbedaan utama adalah skenario pengguna akhir. Ada beberapa perbedaan mendasar yang tidak memungkinkan Arsitektur CDNA digunakan untuk game atau rendering konten visual.

Kebetulan, AMD sedang mempersiapkan ROCm yang merupakan toolset open-source perusahaan yang terdiri dari compiler, programming API, dan library. Toolset ini akan berfungsi sebagai dasar untuk beban kerja komputasi exascale. ROCm 4.0 terbaru telah meningkatkan compiler menjadi open source dan terpadu untuk mendukung OpenMP 5.0 dan HIP. Sederhananya, persaingan antara AMD dan NVIDIA di segmen HPC melampaui kemampuan sederhana dan kekuatan pemrosesan mentah.