Simak Seberapa Pentingnya Pengolahan Data di Zaman Digital
Agustus 19, 2021Webinar Startalk: Optimasi Multi-Channel Strategi bagi Pemasaran Start-up
Agustus 25, 2021Apakah Kamu pernah mendengar istilah Data Mining? Dalam Ilmu Data Science Data mining adalah suatu proses pengerukan atau pengumpulan informasi penting dari Big Data. Seringkali proses ini menggunakan metode statistika, matematika, hingga menggunakan teknologi artificial intelligence (AI). Data mining sendiri memiliki beberapa nama yaitu Knowledge discovery in databases (KDD), data pattern analyst, data archeology, data dredging, information harvesting, business intelligence, dan lain lain.
Data Mining sendiri memiliki banyak sekali fungsi. Terdapat dua fungsi yaitu fungsi descriptive dan fungsi predictive. Fungsi deskripsi dalam data mining adalah memahami lebih jauh tentang data yang diamati lalu data tersebut dan mengetahui karakteristik dari data yang dimaksud. Fungsi Predictive dari data mining adalah untuk menemukan pola tertentu dari suatu data, pola pola yang telah dapat digunakan untuk memprediksi variabel lainnya yang belum diketahui nilainya ataupun jenisnya?
Terdapat beberapa langkah untuk pengambilan data mining antara lain yaitu:
1. Proses pengambilan data
Data Mining ini memiliki beberapa proses dalam menemukan data yang baru, tahapan-tahapan tersebut dimulai data yang masih raw hingga informasi yang telah diolah dan siap untuk digunakan. Proses tersebut terdiri dari :
- Data Cleansing
Ini merupakan tahapan paling awal, dimana data-data yang tidak lengkap dan masih mempunyai banyak error dan data yang tidak konsisten dibuang dari koleksi data.
- Data Integration
Proses dimana jika terdapat data yang berulang akan digabungkan menjadi satu data di tahap ini.
- Selection
Di tahap ini, data-data yang sudah dibersihkan dan juga sudah digabungkan akan dipilah-pilah menjadi data yang relevan terhadap apa yang dibutuhkan perusahaan.
- Data Transformation
Setelah melewati tahap seleksi akan dikirimkan ke dalam tahap mining procedure melalui agresi data.
- Data Mining
Proses ini merupakan proses yang krusial, karna di tahap ini akan dilakukan berbagai teknik untuk mengekstrak berbagai pola yang potensial untuk mendapatkan data yang berguna.
- Pattern Evolution
Di tahap ini merupakan proses dimana pola-pola potensial yang telah ditemukan akan dilakukan tahapan identifikasi berdasarkan standar yang telah diberikan
- Knowledge Presentation
Di tahap akhir ini, data-data yang sudah dikumpulkan akan diberi visualisasi yang bertujuan untuk membantu client paham dengan hasil data mining ini.
Baca juga Berniat untuk Menjadi Data Scientist? Ikuti 3 Panduan di Bawah Ini Yuk!
2. Teknik-teknik Penambangan Data
Data mining sendiri mempunyai beberapa teknik untuk menambang data, berikut teknik-teknik yang dapat digunakan untuk menambang data :
- Predictive Modeling
Teknik ini menjelaskan sifat dasar kejadian di masa mendatang terhadap peristiwa-peristiwa tertentu berdasarkan apa yang telah terjadi di masa lalu, seperti memprediksi pemenang ‘Super Bowl’ atau memprediksi suhu pada hari tertentu.
- Database Segmentation
Teknik ini mengelompokkan kontak satu dengan yang lainnya sesuai dengan behavior mereka, gender, umur, demografi, interest, dan sebagainya.
- Link Analysis
Teknik ini membuat hubungan antara data-data individu atau sekumpulan record dari database.
- Deviation Detection
Sebuah teknik untuk mengidentifikasi outlier yang mengekspresikan sebuah deviasi dari ekspektasi yang sudah diketahui sebelumnya.
- Nearest Neighbour
Teknik ini merupakan sebuah metode klasifikasi terhadap sekumpulan data berdasarkan pembelajaran data yang sudah terklasifikasikan sebelumya.Teknik ini merupakan teknik tertua dari data mining.
- Clustering
merupakan teknik untuk mengklasifikasikan data berdasarkan kriteria masing-masing data.
- Decision Tree
Merupakan teknik generasi selanjutnya, dimana teknik ini adalah sebuah model prediktif yang dapat digambarkan seperti pohon. Setiap node yang terdapat dalam struktur pohon tersebut mewakili sebuah pertanyaan yang digunakan untuk menggolongkan data.
Baca juga Siapkan Diri Menjadi Data Scientist Profesional dengan Kenali Kompetensi Ini
3. Belajar Pengambilan Data Bersama DQLab!
DQLab siap menemani kamu belajar Data Science secara terstruktur dan sederhana. Bagi kamu yang ingin berkarir sebagai Data Scientist jangan khawatir, karena kamu memiliki kesempatan yang tepat untuk belajar Data Science bersama DQLab UMN.
Mulai belajar bersama DQLab dengan sign up sekarang di DQLab.id dan nikmati pengalaman belajar yang praktis dan aplikatif agar kamu siap bersaing di industri nyata. Selamat belajar Sahabat Data DQLab!
Jadi apalagi yang kamu tunggu, ayo bergabung di DQLab! Kamu bisa belajar data science dari nol hingga bisa bergabung di perusahaan besar. Dengan bergabung sekarang kamu bisa mendapat module GRATIS “Introduction to Data Science” loh!
*by Yohanes Ricky & Annissa Widya Davita | DQLab
Kuliah di Jakarta untuk jurusan program studi Informatika| Sistem Informasi | Teknik Komputer | Teknik Elektro | Teknik Fisika | Akuntansi | Manajemen| Komunikasi Strategis | Jurnalistik | Desain Komunikasi Visual | Film dan Animasi | Arsitektur | D3 Perhotelan , di Universitas Multimedia Nusantara. www.umn.ac.id