Apa itu Model dalam Pembelajaran Mesin – Menuju AI — Publikasi AI dan Teknologi Terkemuka di Dunia

Penulis (s): Atau Izchak

Pembelajaran mesin

Gambar oleh Ali Shah Lakhani – Unsplash

Model Pembelajaran Mesin memainkan peran penting dalam Kecerdasan Buatan. Dengan kata sederhana, mereka adalah representasi matematis. Dengan kata lain, mereka adalah output yang kita terima setelah melatih suatu proses.

Apa yang dilakukan model pembelajaran mesin adalah menemukan pola dalam set data pelatihan. Dengan kata lain, model pembelajaran mesin memetakan input ke output dari dataset yang diberikan.

Model klasifikasi ini dapat diklasifikasikan dengan cara yang berbeda yang disebut Analisis Komponen Utama, Pengurangan Dimensi, Pengelompokan, Model Regresi, Model Klasifikasi, dll. Mari kita cari tahu lebih lanjut tentang mereka.

Apa yang dimaksud dengan membangun model dalam pembelajaran mesin?

Membangun model dalam pembelajaran mesin adalah membuat representasi matematis dengan menggeneralisasi dan belajar dari data pelatihan. Kemudian, model pembelajaran mesin yang dibangun diterapkan pada data baru untuk membuat prediksi dan mendapatkan hasil.

Model yang Anda bangun dapat berupa model regresi atau model klasifikasi berdasarkan variabel target yang dikenal sebagai variabel Y. Jika variabel target memiliki nilai kuantitatif, Anda harus membangun model regresi. Jika tipe data variabel target adalah kualitatif, Anda harus membangun model klasifikasi.

Kurangnya data dapat menjadi tantangan dalam membangun model pembelajaran mesin. Bahkan jika Anda memiliki akses ke data yang cukup, data tersebut harus dalam kondisi baik dan bersih sebelum membuat model.

Apa saja model yang digunakan dalam pembelajaran mesin?

Ada dua jenis pembelajaran mesin: pembelajaran terawasi dan pembelajaran tanpa pengawasan.

Pembelajaran Terawasi:- Dalam pembelajaran terawasi, model pembelajaran mesin mencoba mencari tahu dependensi dan hubungan terbaik antara nilai input dan target. Anda perlu memberikan set data pelatihan input berlabel untuk pembelajaran yang diawasi. Algoritme pembelajaran mesin menemukan pola dari kumpulan data itu. Kemudian, membangun model yang dapat digunakan pada data baru yang disebut data uji.

Pembelajaran Tanpa Pengawasan — Pembelajaran tanpa pengawasan membuat cluster menggunakan data input. Dalam pembelajaran tanpa pengawasan, Anda harus menyediakan kumpulan data tanpa nilai keluaran. Jadi, model pembelajaran mesin dapat mengetahui pola, aturan, dan ringkasan titik data yang serupa.

Mari kita lihat perbedaan jenis model pembelajaran terawasi dan tidak terawasi.

Jenis Model Pembelajaran Terawasi

Model Regresi — Anda dapat membuat model regresi jika variabel keluaran dari masalah Anda memiliki nilai kontinu. Misalnya, Anda membuat model regresi untuk memprediksi harga rumah.

Model Klasifikasi — Anda dapat membuat model klasifikasi untuk memprediksi kelas atau tipe objek dari sejumlah opsi yang terbatas. Dalam model ini, variabel output selalu kategoris.

Model klasifikasi terdiri dari dua jenis. Yaitu model klasifikasi multiclass dan model klasifikasi biner. Model klasifikasi multiclass digunakan untuk memprediksi beberapa kelas (lebih dari dua hasil), sedangkan model klasifikasi biner menghasilkan prediksi untuk hasil biner (satu dari dua hasil).

Misalnya, Anda harus membangun model klasifikasi multikelas untuk memprediksi apakah suatu produk adalah pakaian, makanan, atau buku. Demikian pula, Anda harus membangun model klasifikasi biner untuk memprediksi apakah email adalah spam atau bukan.

Jenis Model Pembelajaran Tanpa Pengawasan

Pengelompokan — Anda dapat membuat model pengelompokan untuk mengelompokkan item serupa. Ini memungkinkan Anda untuk mengidentifikasi item serupa dengan cepat tanpa intervensi manual.

Aturan Asosiasi — Anda dapat membuat model aturan asosiasi untuk menemukan asosiasi dalam data. Misalnya, jika Anda membeli smartphone, kemungkinan besar Anda juga akan membeli casing ponsel.

Pengurangan Dimensi — Anda dapat membuat model pengurangan dimensi untuk menggeneralisasi data dan mengekstrak informasi yang berarti.

Pembelajaran Mendalam — Dalam pembelajaran mendalam, Anda menggunakan jaringan saraf untuk membangun model pembelajaran mesin. Model deep learning dapat diklasifikasikan sebagai Autoencoder, mesin Boltzmann, Recurrent Neural Networks, Convolution Neural Networks, dan perceptron Multi-Layer berdasarkan arsitektur jaringan saraf mereka. Anda dapat menggunakan model deep learning dalam machine learning yang diawasi atau tidak.

Apa metrik terpenting dalam menentukan nilai model pembelajaran mesin?

Jadi sekarang setelah Anda mengetahui berbagai jenis model yang tersedia di ML, metrik apa yang paling penting untuk menentukan nilai model pembelajaran mesin.

Metrik terpenting dari model pembelajaran mesin klasifikasi adalah akurasi. Akurasi adalah rasio jumlah total prediksi yang benar dengan jumlah total titik data dalam kumpulan data pengujian.

Akurasi adalah cara untuk menilai kinerja model, tetapi ada cara lain. Namun, akurasi memberikan perspektif terbaik tentang kinerja model untuk kumpulan data tertentu dibandingkan dengan metrik lainnya.

Kami menggunakan metrik untuk mengevaluasi kinerja model. Selanjutnya, kita akan membahas parameter model yang dibutuhkan model untuk membuat prediksi.

Apa yang dimaksud dengan parameter model dalam pembelajaran mesin?

Parameter model adalah nilai yang dipelajari dan diperkirakan selama pelatihan dari kumpulan data. Nilai harus diperkirakan dari data pelatihan. Jadi, parameter model adalah variabel internal dari model machine learning.

Nilai parameter model ditetapkan berdasarkan pelatihan. Model pembelajaran mesin menggunakan nilai ini untuk membuat prediksi. Kinerja model didasarkan pada keakuratan nilai parameter model.

Nilai parameter model memiliki beberapa tingkat kontrol atas kompleksitas model. Pada bagian selanjutnya, kita akan membahas kurva kompleksitas suatu model.

Apa yang dimaksud dengan kurva kompleksitas model dalam pembelajaran mesin?

Kurva kompleksitas model adalah plot grafis yang digunakan untuk mengekspresikan kompleksitas model. Ini menunjukkan peningkatan relatif informasi ketika ukuran sampel tumbuh.

Kurva kompleksitas dapat digunakan untuk pemangkasan data dan dapat mempercepat proses pembelajaran tanpa mempengaruhi akurasi klasifikasi.

Kurva kompleksitas memungkinkan Anda untuk membandingkan kinerja model pada data pelatihan dan validasi saat model menjadi lebih kompleks atau kurang kompleks.

Secara umum, model yang lebih kompleks memberikan kinerja terbaik dibandingkan dengan model sederhana. Ada banyak parameter dalam model yang kompleks. Oleh karena itu, mereka dapat memberikan kesesuaian yang baik untuk hasil yang diinginkan dengan menyesuaikan parameter ini selama pelatihan. Jadi, tingkat kesalahan mereka akan jauh lebih rendah.

Dalam pembelajaran mesin, apa itu artefak model?

Saat melatih model ML, Anda harus memberikan data pelatihan ke algoritme pembelajaran mesin untuk dipelajari. Artefak adalah output yang dihasilkan dari proses pelatihan. Ini bisa berupa file yang dihasilkan oleh proses pelatihan, pos pemeriksaan model, atau model yang sepenuhnya terlatih. Misalnya, jika Anda melatih model pembelajaran mendalam, Anda mendapatkan bobot terlatih sebagai hasilnya. Jadi, mereka adalah artefak.

Apa urutan langkah yang benar untuk diambil dalam membangun model pembelajaran mesin?

Ada tujuh langkah yang perlu Anda ikuti saat membuat model pembelajaran mesin. Anda tidak boleh mengabaikan salah satu dari 7 langkah kunci ini dalam pengembangan model pembelajaran mesin.

1. Kumpulkan Data — Pertama-tama, Anda harus mengumpulkan data. Langkah ini sangat penting karena kualitas dan jumlah data yang Anda kumpulkan memiliki dampak besar pada keluaran model pembelajaran mesin Anda.

2. Siapkan Data — Anda perlu membentuk data bisnis yang dikumpulkan agar dapat digunakan untuk melatih model pembelajaran mesin. Performa model pembelajaran mesin didasarkan pada kualitas data. Mempersiapkan data berarti pra-pemrosesan data dengan menghapus duplikat, mengoreksi kesalahan, dan normalisasi. Jadi persiapan data melibatkan pembersihan data, transformasi, agregasi, normalisasi, augmentasi, dan pelabelan data.

3. Pilih model — Saat data Anda dalam bentuk yang dapat digunakan, Anda dapat memilih model mesin Anda. Anda harus memilih model pembelajaran mesin yang sesuai berdasarkan tujuan bisnis Anda. Bergantung pada target yang ingin Anda capai, Anda dapat memilih model pembelajaran mesin termasuk regresi linier, pembelajaran mendalam, pengelompokan, klasifikasi, dan sebagainya. Memilih model yang tepat untuk data Anda bisa menjadi keputusan yang sulit dan terkadang membutuhkan banyak percobaan dan kesalahan dari model yang berbeda, berikut adalah peta yang bagus yang dapat membantu untuk memilih tautan model yang tepat.

4. Latih model Anda — Melatih model pembelajaran mesin adalah inti dari pembuatan model pembelajaran mesin. Model pembelajaran mesin akan melalui bagian pembelajaran dalam tahap ini. Pada tahap ini model akan melalui pelatihan ulang hingga model machine learning memberikan tingkat akurasi yang diinginkan.

5. Evaluasi — Pada langkah evaluasi, Anda melakukan jaminan kualitas untuk model pembelajaran mesin Anda. Anda mengevaluasi model machine learning Anda menggunakan perhitungan matriks, pengukuran kualitas, dan pendekatan metrik model.

6. Penyetelan parameter

Setelah Anda melakukan evaluasi, Anda dapat memeriksa apakah Anda dapat lebih meningkatkan pelatihan. Anda harus melakukan penyetelan parameter untuk itu. Anda dapat menampilkan set data lengkap ke model Anda, sehingga dapat menyempurnakan parameter dan meningkatkan prediksi. Anda juga dapat menampilkan set data lengkap beberapa penghitung waktu untuk memungkinkan model membuat prediksi yang lebih akurat.

7. Prediksi atau Inferensi — Setelah Anda menyelesaikan semua langkah sebelumnya, Anda dapat menggunakan model pembelajaran mesin Anda dalam skenario kehidupan nyata. Tahap akhir dari proses pembuatan model disebut prediksi atau inferensi. Ini adalah tahap penerapan model di mana Anda dapat menggunakan model pembelajaran mesin untuk memecahkan masalah dunia nyata. Proses ini melibatkan penyajian model pembelajaran mesin dalam produksi.

Manajemen Model Pembelajaran Mesin memainkan peran penting di sini karena memungkinkan untuk membawa model pembelajaran mesin dari tahap pengembangan ke tingkat produksi. Anda dapat menggunakan pembelajaran mesin Azure untuk penerapan manajemen model.

Anda dapat menggunakan alur pembelajaran mesin untuk mengotomatiskan alur kerja pembelajaran mesin ini. Ini memungkinkan Anda untuk mengkorelasikan dan mengubah data urutan bersama-sama dalam sebuah model, sehingga Anda dapat mencapai output yang diinginkan. Pipeline pembelajaran mesin dapat mengubah format data mentah menjadi informasi berguna yang dapat Anda gunakan untuk mengekstrak wawasan.

Kesimpulan

Memilih model pembelajaran mesin yang tepat untuk kasus penggunaan tertentu sangat penting untuk mendapatkan hasil yang diinginkan. Anda dapat menentukan KPI dan metrik evaluasi untuk membandingkan kinerja antara model pembelajaran mesin yang berbeda untuk masalah bisnis spesifik Anda. Anda dapat memilih model terbaik setelah memeriksa kinerja statistik setiap model.

Apa itu Model dalam Pembelajaran Mesin awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Menuju AI