Google Menawarkan Kumpulan Meta-Dataset Gratis Dengan AI Pembelajaran Mendalam Sedikit-Tembakan dan Algoritma Pembelajaran Mesin Untuk Klasifikasi Gambar yang Cepat Dan Efisien Di TensorFlow dan PyTorch
Google telah mengumumkan ketersediaan beberapa set data yang terdiri dari gambar alami yang beragam tetapi terbatas. Raksasa pencarian yakin data yang tersedia untuk umum akan mendorong laju Pembelajaran Mesin dan Kecerdasan Buatan sekaligus mengurangi waktu yang dibutuhkan untuk melatih model AI pada jumlah data minimal. Google menyebut inisiatif baru 'Set Meta-Data Gratis' yang akan membantu model AI 'belajar' dengan lebih sedikit data. 'Few-Shot AI' dari perusahaan dioptimalkan untuk memastikan AI mempelajari kelas-kelas baru hanya dari beberapa gambar yang representatif.
Memahami kebutuhan untuk melatih model AI dan Machine Learning dengan cepat dengan set data yang lebih sedikit, Google telah meluncurkan 'Meta-Dataset', sekumpulan kecil gambar yang akan membantu mengurangi jumlah data yang diperlukan untuk meningkatkan keakuratan algoritme. Perusahaan mengklaim bahwa dengan menggunakan teknik klasifikasi gambar beberapa bidikan, model AI dan ML akan mendapatkan wawasan yang sama dari gambar representatif yang jauh lebih sedikit.
Google AI Mengumumkan Meta-Dataset: Set Dataset Untuk Pembelajaran Few-Shot:
Pembelajaran Mendalam untuk AI dan Pembelajaran Mesin telah berkembang secara eksponensial selama beberapa waktu. Namun, syarat utamanya adalah ketersediaan data yang berkualitas tinggi dan juga dalam jumlah yang besar. Data pelatihan yang dianotasi secara manual dalam jumlah besar seringkali sulit diperoleh dan terkadang tidak dapat diandalkan juga. Memahami risiko dataset besar, Google telah mengumumkan ketersediaan kumpulan meta-dataset.
Melalui "Meta-Dataset: A Dataset of Dataset for Learning to Learn from Beberapa Contoh" (disajikan di ICLR 2020), Google telah mengusulkan tolok ukur skala besar dan beragam untuk mengukur kompetensi model klasifikasi gambar yang berbeda dalam beberapa yang realistis dan menantang -pengaturan foto, menawarkan kerangka kerja di mana seseorang dapat menyelidiki beberapa aspek penting dari klasifikasi beberapa gambar. Pada dasarnya, Google menawarkan 10 set data gambar alam yang tersedia untuk umum dan gratis untuk digunakan. Dataset ini terdiri dari ImageNet, CUB-200-2011, Fungi, karakter tulisan tangan, dan coretan. Kode ini bersifat publik dan menyertakan notebook yang menunjukkan bagaimana Meta-Dataset dapat digunakan di TensorFlow dan PyTorch.
Klasifikasi sedikit melampaui pelatihan standar dan model pembelajaran mendalam. Dibutuhkan generalisasi ke kelas yang sama sekali baru pada waktu ujian. Dengan kata lain, gambar yang digunakan selama pengujian tidak terlihat dalam pelatihan. Dalam klasifikasi beberapa tembakan, set pelatihan berisi kelas yang sepenuhnya terpisah dari kelas yang akan muncul pada waktu pengujian. Setiap tugas pengujian berisi a set dukungandari beberapa gambar berlabel yang darinya model dapat mempelajari tentang kelas-kelas baru dan pemutusan hubungan kerja set kuericontoh yang kemudian diminta untuk diklasifikasikan oleh model.
Sebuah Meta-Dataset adalah komponen besar dimana model studi generalisasi untuk dataset yang sama sekali baru, dari mana tidak ada gambar kelas mana pun yang terlihat dalam pelatihan. Ini merupakan tambahan dari tantangan generalisasi yang sulit untuk kelas-kelas baru yang melekat dalam penyiapan pembelajaran beberapa tahap.
Bagaimana Meta-Dataset Membantu Deep Learning Untuk Model AI dan Machine Learning?
Meta-Dataset mewakili tolok ukur terorganisir berskala terbesar untuk set data silang, klasifikasi gambar beberapa gambar hingga saat ini. Ini juga memperkenalkan algoritma pengambilan sampel untuk menghasilkan tugas dengan berbagai karakteristik dan kesulitan, dengan memvariasikan jumlah kelas di setiap tugas, jumlah contoh yang tersedia per kelas, memperkenalkan ketidakseimbangan kelas, dan, untuk beberapa set data, memvariasikan tingkat kesamaan antara kelas dari setiap tugas.
Meta-Dataset memang memperkenalkan tantangan baru untuk klasifikasi beberapa jepretan. Penelitian Google masih pendahuluan dan ada banyak hal yang harus dibahas. Namun, raksasa pencari tersebut mengklaim bahwa para peneliti sedang mengalami kesuksesan. Beberapa contoh penting termasuk penggunaan pengkondisian tugas yang dirancang dengan cerdik, penyetelan hyperparameter yang lebih canggih, 'meta-baseline' yang menggabungkan manfaat pra-pelatihan dan meta-pembelajaran, dan terakhir menggunakan pemilihan fitur untuk mengkhususkan representasi universal untuk setiap tugas. .