Tensor Cores Nvidia untuk Machine Learning dan AI - Dijelaskan

Seri kartu grafis RTX Nvidia yang sekarang terkenal telah sangat sukses sejak diluncurkan dengan seri RTX 20. Pengenalan merek RTX merupakan perubahan arah perusahaan dan sebagai hasilnya, pasar kartu grafis secara keseluruhan. Nvidia telah mengikuti seri RTX pertamanya dengan sukses dengan peluncuran seri RTX 30 pada tahun 2020, meskipun peluncurannya sendiri sedikit mengecewakan karena masalah stok dan ketersediaan di seluruh dunia. Meski begitu, merek RTX tetap menjadi kekuatan dominan di pasar kartu grafis saat ini.

Dengan diperkenalkannya RTX, Nvidia telah menghadirkan dukungan untuk Ray Tracing secara real-time dalam game, yang mengubah cara cahaya berperilaku di lingkungan game. Kami telah membandingkan dua bentuk rendering, Ray Tracing dan Rasterized Rendering, secara mendetail dan Ray Tracing serba guna memang tampak seperti cara untuk melangkah sejauh menyangkut masa depan game. Nvidia juga menyertakan core khusus yang didedikasikan untuk Ray Tracing dalam kartu RTX mereka yang dikenal sebagai RT Cores, yang menangani sebagian besar beban kerja rendering saat berhubungan dengan Ray Tracing dalam game. Apa yang kebanyakan orang mungkin tidak tahu, adalah bahwa Nvidia juga telah memperkenalkan satu set inti dengan kartu Turing dan Ampere mereka yang dikenal sebagai Tensor Cores.

Tensor Core

Tensor Cores adalah inti fisik yang didedikasikan untuk komputasi kompleks yang terlibat dalam tugas-tugas seperti pembelajaran mesin dan AI. Tensor Cores memungkinkan komputasi presisi campuran, yang secara dinamis mengadaptasi kalkulasi untuk mempercepat throughput sekaligus menjaga akurasi. Core ini telah dirancang secara khusus untuk membantu beban kerja yang kompleks ini agar penghitungan ini lebih efisien, serta untuk meringankan core CUDA utama kartu dari beban tambahan.

Dalam kartu konsumen seperti rangkaian kartu GeForce yang berfokus pada game berdasarkan arsitektur Turing atau Ampere, Tensor Cores tidak secara khusus memiliki tugas rendering. Core ini tidak merender frame atau membantu dalam jumlah kinerja umum seperti core CUDA normal atau Core RT yang mungkin dilakukan. Kehadiran Tensor Cores di kartu-kartu ini memang memiliki tujuan. Core ini menangani sebagian besar kekuatan pemrosesan di balik fitur Deep Learning Super Sampling atau DLSS yang sangat baik dari Nvidia. Kami akan menjelajahi DLSS sebentar lagi, tetapi pertama-tama, kami harus mengidentifikasi kartu mana yang benar-benar memiliki Tensor Cores.

Pada saat penulisan, hanya ada beberapa kartu yang menampilkan Tensor Cores di dalamnya. Nvidia pertama kali mengintegrasikan Tensor Cores ke dalam Nvidia TITAN V yang merupakan kartu stasiun kerja berdasarkan arsitektur Volta. Arsitektur ini tidak pernah diperkecil ke kartu grafis tingkat konsumen dan karenanya arsitektur Volta tidak pernah terlihat di GPU GeForce. Setelah itu, Nvidia memperkenalkan inti Tensor dalam sekumpulan GPU Quadro, dan yang lebih penting bagi para gamer, kartu RTX berdasarkan arsitektur Turing dan Ampere. Ini berarti bahwa semua kartu grafis bermerek RTX dari RTX 2060 hingga RTX 3090 memiliki Tensor Cores dan dapat memanfaatkan fitur DLSS Nvidia.

Bagaimana Cara Kerja Tensor Cores?

Meskipun proses sebenarnya di balik kerja Tensor Core cukup rumit, ini dapat diringkas dalam tiga poin.

  • Tensor Core mengurangi siklus bekas yang diperlukan untuk menghitung operasi perkalian dan penjumlahan, 16 kali lipat - dalam contoh saya, untuk matriks 32 × 32, dari 128 siklus menjadi 8 siklus.
  • Tensor Core mengurangi ketergantungan pada akses memori bersama yang berulang, sehingga menghemat siklus tambahan untuk akses memori.
  • Tensor Cores sangat cepat sehingga komputasi tidak lagi menjadi hambatan. Satu-satunya hambatan adalah mendapatkan data ke Tensor Cores.

Dengan kata sederhana, Tensor Cores digunakan untuk melakukan perhitungan yang sangat kompleks yang akan memakan waktu yang tidak masuk akal bagi core non-khusus lainnya seperti core CUDA. Karena sifat spesifiknya, Tensor Core jelas sangat baik dalam melakukan pekerjaan semacam ini. Padahal, saat pertama kali Volta muncul, Anandtech melakukan beberapa tes matematika dengan menggunakan 3 kartu Nvidia. Kartu Volta baru, kartu grafis Pascal kelas atas, dan kartu Maxwell TITAN yang lebih lama semuanya disertakan dan inilah hasilnya.

Dalam bagan ini, istilah presisi mengacu pada jumlah bit yang digunakan untuk bilangan floating point dalam matriks dengan double menjadi 64, single 32, dan seterusnya. Hasil ini dengan jelas menunjukkan bahwa Tensor Cores jauh di depan inti CUDA standar dalam hal komputasi tensor khusus seperti ini.

Aplikasi

Tapi apa sebenarnya aplikasi dari Tensor Cores ini? Karena Tensor Cores dapat mempercepat proses kompleks seperti Pelatihan AI sebanyak 10 kali, ada beberapa area dalam AI dan Deep Learning yang dapat digunakan Tensor Cores. Berikut adalah beberapa area umum di mana Tensor Cores dapat digunakan.

Pembelajaran Mendalam

Satu area di mana Tensor Cores dan kartu yang memilikinya dapat sangat bermanfaat adalah bidang Pembelajaran Mendalam. Ini sebenarnya adalah subbidang pembelajaran mesin yang berkaitan dengan algoritma yang terinspirasi oleh struktur dan fungsi otak yang disebut jaringan saraf tiruan. Deep Learning adalah bidang luas yang mencakup seluruh bidang subjek yang menarik. Inti dari pembelajaran mendalam adalah sekarang kami memiliki komputer yang cukup cepat dan data yang cukup untuk benar-benar melatih jaringan saraf yang besar.

Di sinilah Tensor Cores berperan. Meskipun kartu grafis normal mungkin cukup untuk operasi skala kecil atau pada tingkat individu, proses ini membutuhkan banyak tenaga komputasi khusus ketika diterapkan pada skala yang lebih besar. Jika sebuah organisasi seperti Nvidia sendiri ingin mengerjakan Deep Learning sebagai sebuah bidang, maka kartu grafis dengan kekuatan komputasi spesifik Tensor Cores menjadi sebuah kebutuhan. Tensor Cores menangani beban kerja ini dengan jauh lebih efisien dan cepat daripada bentuk inti komputasi lainnya yang tersedia saat ini. Kekhususan ini menjadikan core ini dan kartu yang memuatnya menjadi aset berharga untuk industri Pembelajaran Mendalam.

Kecerdasan buatan

Kita semua pernah melihat filmnya. Kecerdasan Buatan seharusnya menjadi hal besar berikutnya di bidang komputasi dan robotika. Artificial Intelligence atau AI mengacu pada simulasi kecerdasan manusia di mesin yang diprogram untuk berpikir seperti manusia dan melakukan tindakan serupa. Sifat seperti belajar dan pemecahan masalah juga termasuk dalam kategori kecerdasan buatan.

Perlu dicatat bahwa kecerdasan buatan tidak hanya terbatas pada kecerdasan di mesin seperti yang kita lihat di film-film. Jenis kecerdasan ini sebenarnya sangat umum di beberapa aplikasi saat ini. Asisten virtual kami di ponsel kami juga menggunakan bentuk kecerdasan buatan. Di dunia game, semua musuh dan NPC yang dihasilkan dan dikendalikan komputer juga menunjukkan tingkat kecerdasan buatan tertentu. Apa pun yang memiliki kecenderungan mirip manusia atau nuansa perilaku dalam lingkungan simulasi menggunakan kecerdasan buatan.

Bidang kecerdasan buatan juga membutuhkan banyak kekhususan komputasi dan ini adalah area lain di mana kartu grafis yang ditenagai oleh Tensor Cores pasti berguna. Nvidia adalah salah satu pemimpin dunia dalam hal AI dan Deep Learning, dan produk mereka seperti Tensor Cores dan fitur seperti Deep Learning Super Sampling yang terkenal dari Nvidia adalah bukti posisi mereka.

Pengambilan Sampel Super Pembelajaran Mendalam

DLSS adalah salah satu aplikasi Tensor Core terbaik yang saat ini ditemukan di industri. DLSS atau Deep Learning Super Sampling adalah teknik Nvidia untuk smart upscaling, yang dapat mengambil gambar yang dirender dengan resolusi lebih rendah dan meningkatkannya ke tampilan resolusi yang lebih tinggi, sehingga memberikan performa yang lebih baik daripada rendering asli. Nvidia memperkenalkan teknik ini dengan kartu grafis seri RTX generasi pertama. DLSS bukan hanya teknik untuk peningkatan skala atau supersampling biasa, melainkan menggunakan AI untuk secara cerdas meningkatkan kualitas gambar yang dirender pada resolusi yang lebih rendah untuk menjaga kualitas gambar. Secara teori, hal ini dapat memberikan yang terbaik dari kedua dunia karena gambar yang ditampilkan akan tetap berkualitas tinggi sementara kinerja juga akan ditingkatkan melalui rendering asli.

DLSS memanfaatkan kekuatan AI untuk menghitung dengan cerdas cara merender gambar pada resolusi yang lebih rendah sambil menjaga kualitas maksimum tetap utuh. Ini menggunakan kekuatan kartu RTX baru untuk melakukan komputasi kompleks dan kemudian menggunakan data tersebut untuk menyesuaikan gambar akhir agar terlihat sedekat mungkin dengan rendering asli. Fitur ciri khas DLSS adalah konservasi kualitasnya yang sangat mengesankan. Menggunakan upscaling tradisional menggunakan menu game, pemain pasti dapat melihat kurangnya ketajaman dan ketajaman game setelah dirender pada resolusi yang lebih rendah. Ini bukan masalah saat menggunakan DLSS. Meskipun itu membuat gambar pada resolusi yang lebih rendah (seringkali sebanyak 66% dari resolusi asli), gambar yang ditingkatkan ukurannya jauh lebih baik daripada apa yang akan Anda dapatkan dari peningkatan tradisional. Ini sangat mengesankan sehingga sebagian besar pemain tidak dapat membedakan antara gambar yang dirender secara asli pada resolusi yang lebih tinggi, dan gambar yang ditingkatkan oleh DLSS.

Keuntungan DLSS yang paling menonjol dan seluruh insentif di balik pengembangannya adalah peningkatan kinerja yang signifikan saat DLSS diaktifkan. Performa ini berasal dari fakta sederhana bahwa DLSS merender game pada resolusi yang lebih rendah, dan kemudian meningkatkannya menggunakan AI untuk mencocokkan resolusi keluaran monitor. Dengan menggunakan fitur pembelajaran mendalam dari kartu grafis seri RTX, DLSS dapat mengeluarkan gambar dalam kualitas yang sesuai dengan gambar yang dirender secara asli.

Nvidia telah menjelaskan mekanisme di balik teknologi DLSS 2.0-nya di situs resminya. Kita tahu bahwa Nvidia menggunakan sistem yang disebut Neural Graphics Framework atau NGX, yang menggunakan kemampuan superkomputer bertenaga NGX untuk belajar dan menjadi lebih baik dalam komputasi AI. DLSS 2.0 memiliki dua input utama ke dalam jaringan AI:

  • Resolusi rendah, gambar alias yang dirender oleh mesin game
  • Resolusi rendah, vektor gerak dari gambar yang sama - juga dihasilkan oleh mesin permainan

Nvidia kemudian menggunakan proses yang dikenal sebagai umpan balik temporal untuk "memperkirakan" seperti apa bingkai itu nantinya. Kemudian, jenis AI autoencoder khusus mengambil frame saat ini beresolusi rendah, dan frame sebelumnya beresolusi tinggi untuk menentukan berdasarkan piksel demi piksel bagaimana menghasilkan frame saat ini dengan kualitas yang lebih tinggi. Nvidia juga secara bersamaan mengambil langkah untuk meningkatkan pemahaman superkomputer tentang proses tersebut:

Aplikasi Masa Depan

Seperti yang bisa kita lihat dari aplikasi seperti deep learning, kecerdasan buatan, dan terutama fitur DLSS yang kini diperkenalkan Nvidia, Tensor Cores dari kartu grafis ini melakukan banyak tugas menarik dan penting. Sulit untuk memprediksi masa depan bidang-bidang ini, tetapi orang pasti dapat membuat prediksi yang cerdas berdasarkan data saat ini dan tren industri.

Saat ini, dorongan global dalam bidang-bidang seperti kecerdasan buatan dan pembelajaran mesin berada pada titik tertinggi sepanjang masa. Aman untuk mengasumsikan bahwa Nvidia akan memperluas jajaran kartu grafisnya yang mencakup Tensor Cores dalam waktu dekat, dan kartu-kartu itu akan berguna untuk aplikasi ini. Selain itu, DLSS adalah aplikasi hebat lainnya dari teknologi pembelajaran mendalam yang memanfaatkan Tensor Cores, dan itu mungkin juga akan melihat peningkatan besar dalam waktu dekat. Ini adalah salah satu fitur paling menarik dan paling produktif untuk memukul industri PC Gaming dalam beberapa tahun terakhir sehingga orang harus berasumsi bahwa itu akan tetap ada.

Dengan kekuatan Tensor Cores, kemajuan di bidang pembelajaran mesin dan kecerdasan buatan dibuat dengan sangat cepat. Proses ini kemungkinan besar akan terus berlanjut dan diperkuat dengan perusahaan seperti Nvidia yang mengambil alih dan memimpin industri PC Gaming dalam hal penerapan pengetahuan bidang ini dalam game yang kami mainkan.

Facebook Twitter Google Plus Pinterest