Radeon Open Compute "ROCm" Stack v3.1 Dirilis Dengan RAS Untuk Vega 7nm, Dukungan SLURM Untuk Manajemen Sumber Daya Lebih Baik, Tapi Navi Masih Hilang

Radeon Open Compute atau versi baru tumpukan "ROCm" sekarang tersedia untuk diunduh. Radeon Open Compute v3.1 menghadirkan beberapa fitur, tetapi anehnya, dukungan untuk AMD Navi serta GFX10 masih hilang.

ROCm, platform universal yang paling banyak diterima untuk komputasi akselerasi GPU, sekarang ada di versi 3.1. Pembaruan terbaru untuk platform modular yang memungkinkan vendor perangkat keras untuk membangun driver yang mendukung kerangka ROCm mencakup beberapa fitur yang sangat dinantikan seperti dukungan RAS untuk 7nm Vega dan dukungan SLURM untuk GPU AMD. Namun, untuk alasan yang belum diketahui, ROCm masih belum memiliki dukungan penuh untuk Arsitektur AMD Navi generasi berikutnya.

Yang Baru Di Radeon ROCm v3.1:

Perubahan terbesar dan paling jelas dalam penginstalan baru Radeon ROCm v3.1 ada di Struktur Direktori Instalasi ROCm. Instalasi baru dari toolkit ROCm menginstal paket-paket di/ opt / rocm- map. Sebelumnya, paket toolkit ROCm diinstal di file/ opt / rocm map.

Versi baru ROCm telah meningkatkan dukungan Reliability, Accessibility, and Serviceability (RAS) untuk GPU Vega 7nm. Pekerjaan Vega 7nm ini mungkin masih di bawah mikroskop untuk "Arcturus" berbasis Vega komputasi akselerator datang tahun ini. Dukungan tersebut meliputi:

  • UMC RAS ​​- HBM ECC (injeksi kesalahan yang tidak dapat diperbaiki), penghentian halaman, pemulihan RAS melalui pengaturan ulang GPU (BACO)
  • GFX RAS - GFX, MMHUB ECC (injeksi kesalahan tidak dapat diperbaiki), pemulihan RAS melalui pengaturan ulang GPU (BACO)
  • PCIE RAS - PCIE_BIF ECC (injeksi kesalahan tidak dapat diperbaiki), pemulihan RAS melalui GPU (BACO) reset

Radeon ROCm v3.1 juga mendapat Dukungan SLURM untuk GPU AMD. SLURM atau Utilitas Linux Sederhana untuk Manajemen Sumber Daya adalah salah satu sistem manajemen klaster dan penjadwalan pekerjaan yang sangat disukai dan mudah digunakan untuk klaster Linux. SLURM lebih disukai karena bersifat open-source, toleran terhadap kesalahan, dan sangat skalabel.

Sistem ini sekarang dapat berinteraksi dengan baik dengan GPU AMD. SLURM versi terbaru 20.02.0 menyertakan plugin AMD yang memungkinkan SLURM mendeteksi dan mengkonfigurasi GPU AMD secara otomatis. Ia juga mengumpulkan dan melaporkan konsumsi energi dari chip grafis. Dukungan SLURM adalah tambahan yang berguna mengingat semakin banyaknya penerapan komputasi super yang menggunakan GPU Radeon dan cluster GPU AMD yang lebih besar lainnya.

Meskipun beberapa fitur telah dimasukkan, masih belum ada tanda-tanda dukungan GFX10 / Navi di ROCm. Halaman GitHub untuk ROCm telah diperbarui untuk mencerminkan semua perubahan, catatan penginstalan, dan masalah yang diketahui.

Facebook Twitter Google Plus Pinterest