UMN Terima Kunjungan Studi Banding MBKM dari LLDIKTI Wilayah XIV Papua dan Papua Barat
Maret 23, 2022UMN Perpanjang Kehadiran Tax Centre
Maret 28, 2022Tangerang – Masih dalam serangangkaian Tetris Program yang diadakan DQLab, sebagai bentuk dukungan DQLab kepada anak muda untuk belajar data science serta berkarir sebagai praktisi data. Masuk ke hari kelima, pada sesi ini Tetris Program membawakan materi tentang R special Intro to Supervised Machine Learning with R. Yang akan dipaparkan langsung secara daring oleh Erika Siregar selaku Co-Founder di R-Ledies Jakarta. Di hari kelima ini, Erika memberikan materi pengenalan singkat machine learning, supervised & unsupervised, classification dan library caret. Sesi ini dilaksanakan pada Jumat, 18 Maret 2022, sebagai lanjutan dari sesi sebelumnya.
Machine learning adalah bagian dari Artificial Intelligence (AI), yang identik digunakan untuk membuat kesimpulan dan prediksi. Sederhananya, manusia melakukan pemodelan agar mesin dapat menebak atau membuat prediksi tanpa harus diarahkan. Agar mesin tersebut dapat berjalan dengan baik, diperlukan pembelajaran untuk mesin tersebut dengan cara supervised dan unsupervised learning.
“Dengan machine learning, kita membuat mesin ini pandai sendiri,” kata Erika.
Supervised adalah pembelajaran terarah, maksudnya manusia dapat melatih mesin dengan menggunakan data yang sudah diberi label atau jawaban yang benar. Sederhananya seperti pembelajaran langsung oleh guru. Sedangkan unsupervised adalah pembelajaran tak terarah, artinya teknik pembelajaran mesin ini tidak perlu pengawasan dari manusia, namun perlu mengizinkan model bekerja sendiri untuk menemukan informasi yang dibutuhkan. Erika juga memberikan contoh penggunaan supervised learning, seperti untuk mendeteksi spam pada email (classification), memprediksi penjualan (regresi) dan movie recommendation. Sedangkan unsupervised learning biasa digunakan untuk clustering dan customer segmentation.
Erika menjabarkan lagi dua contoh penggunaan supervised learning, yakni classification dan regression. Perbedaanya adalah regression menjawab pertanyaan yang sifatnya numerik, sedangkan classification menjawab pertanyaan yang sifatnya kategorik. Ada beberapa algoritma classification, yaitu k-nearest neighbors (knn), naive bayes, decision tress.
Baca juga Mengenal Pentingnya ETL untuk Mahasiswa dalam Pengolahan Data
Dilanjutkan dengan caret, salah satu library R yang dibuat khusus untuk supervised machine learning in R. Caret merupakan singkatan dari Classification and Regression Training. Caret bisa diinstal dengan mengetik install.packages(‘caret’) atau langsung masuk R studio, klik install dan ketik caret. Untuk belajar caret ini, terdapat buku panduan yang bisa diakses melalui https://github.com/topepo/caret.
“Dalam mengerjakan supervised machine learning di R, kita perlu bantuan the tidyverse family, yakni dplyr, tidyr dan ggplot,” ucap Erika.
Sebelum memulai ngoding, Erika memberikan arahan bahwa untuk supervised machine learning harus menguno tipe dataset terlebih dahulu. Lalu split dataset menjadi dua, yakni data training dan data testing. Data training merupakan data yang digunakan mesin untuk belajar, sehingga bisa menghasilkan model. Sedangkan data testing adalah data yang digunakan untuk menguji akurasi dari model. Rasio yang sering digunakan orang-orang dalam membagi dataset adalah 80%:20%, 75%:25% dan 70%:30%.
Sambil mempraktekkan coding langsung pada R studio, Erika menjelaskan tentang one hot encoding. One hot encoding merupakan proses untuk membuat kolom baru dari variabel kategorikal, di mana setiap kategori menjadi kolom baru dengan nilai 0 atau 1 (0 mewakili tidak ada dan 1 mewakili ada).
Menerapkan library caret langsung pada R studio sekaligus menjadi penutup pembahasan pada sesi ini. DQLab tidak hanya mengadakan Tetris Program, namun masih banyak program data science khususnya untuk pemula.
*by Agnes Nurlisa | DQLab
Kuliah di Jakarta untuk jurusan program studi Informatika| Sistem Informasi | Teknik Komputer | Teknik Elektro | Teknik Fisika | Akuntansi | Manajemen| Komunikasi Strategis | Jurnalistik | Desain Komunikasi Visual | Film dan Animasi | Arsitektur | D3 Perhotelan , di Universitas Multimedia Nusantara. www.umn.ac.id