Tahu Kah Kamu? Bahasa R Tertanya Penting untuk Dikuasai NON IT
Maret 17, 2022SELAMAT! CANDY MONSTER dari UMN Pictures Kembali Meraih Penghargaan
Maret 17, 2022Tangerang – Memasuki sesi ketiga, Tetris Program membawakan pembahasan cara menggunakan Pentaho Data Integration untuk extract data dari file text dan file excel, yang merupakan materi lanjutan dari Pentaho Data Integration (PDI). Dengan pembicara yang sama, yakni Iqbal Hanif selaku Big Data Analytics di Telkom Indonesia, rangkaian pembelajaran sesi kali ini adalah mengetahui extract data menggunakan PDI, melakukan extract pada data yang terstruktur (Excel, MySQL) dan melakukan extract pada data yang tidak terstruktur (text atau HTML). Sesi ketiga ini dilaksanakan secara daring pada Senin, 7 Maret 2022.
Sebelum memasuki pembahasan utama, Iqbal mengulang materi sebelumnya yang bersangkutan dengan materi hari ini. Extract adalah proses ekstraksi dan pengumpulan data dari berbagai macam sumber, sederhananya ada mengumpulkan data dari berbagai sumber. Beragam sumber data mencangkup database, file, tools/aplikasi, APIs, Website, Sensor dan lain-lain. Extract data pada PDI dapat dilakukan dengan memanfaatkan steps yang ada di folder “Input”. Steps yang sering digunakan adalah table input, Cvs file input, Microsoft excel file input, Text file input, JSON input dan Data grid. Selain itu, untuk extract data dapat memanfaatkan step lain seperti HTTP client.
Selanjutnya, Iqbal mempraktekkan extract pada data terstruktur. Dengan goal, melakukan extract data tabular dari excel dan MySQL. Steps yang dibutuhkan adalah Microsoft Excel input dan Table input. Kemudian langkah pertama adalah membuka ktr dari sesi sebelumnya, lalu save dengan nama berbeda. Selanjutnya Iqbal memberikan penjelasan sekaligus mempraktekkan extract data dari Microsoft Excel.
“Cara baca file dari Excel itu sesuatu yang tidak diakomodir oleh SQL. Jadi kalau saya dapat data dari Excel, cara tercepat saya pakai Pentaho,” ujar Iqbal.
Dilanjutkan dengan extract data dari MySQL. Iqbal menjelaskan langkah awal sebelum ia mempraktekannya. Pastikan database connection ke localhost di PDI sudah tersedia, jika belum bisa dibuat ulang dengan step-step yang sama dengan pertemuan sebelumnya. Kemudian tambahkan step “Table input” ke canvas, lalu klik kanan dan edit. Pilih “Connection” sesuai dengan nama koneksi yang dibuat ke localhost, serta tulis sintaks/query untuk mengambil data di table ms_cabang.
Baca juga Tetris Program #StackYourSkill DQLab Hadir Berikan Beasiswa Data Science Hingga Kesempatan Berkarir
“Dalam tahap ini basic SQL juga harus dipahami dan dipraktekkan terus agar terasah kemampuan SQL nya,” kata Iqbal.
Selain itu, Iqbal juga memberikan pengarahan dan mempraktekkan juga extract pada data tidak terstruktur. Tujuannya adalah melakukan ekstrak data teks dari website (HTML). Steps yang dibutuhkan adalah Data grid, HTTP client. Pada tahap ini, Iqbal melakukan ekstrak HTML code (scraping) dari artikel berita online agar bisa mendapatkan teks dari berita tersebut. Iqbal menbahkan beberapa yang harus diingat ketika extract data dari artikel berita online, pastikan semua artikel teks terbaca dalam satu page, caranya dengan menambahkan “?page=all”. Kemudian pada step “data-grip”, pastikan tidak ada row bernomor yang kosong serta perhatikan kolom “#”, karena hal ini bisa memicu error.
Di akhir sesi, Iqbal menyampaikan menurutnya SQL merupakan bahasa pemrograman yang paling sering digunakan orang dengan latar belakang beragam. Harapan Iqbal, dengan Pentaho peserta dapat menyukai coding sebagai alternatif.
“SQL universal, sedangkan Python belum tentu,” ucap Iqbal.
Sebagai bahasa pemrograman yang sering digunakan, SQL menjadi salah satu alternatif pemula dalam belajar extract data. Menguasai dasar SQL adalah yang paling penting, belajar bersama DQLab.id, untuk menjadi talenta data yang mengagumkan.
by Lathifa Lisa – DQLab
Kuliah di Jakarta untuk jurusan program studi Informatika| Sistem Informasi | Teknik Komputer | Teknik Elektro | Teknik Fisika | Akuntansi | Manajemen| Komunikasi Strategis | Jurnalistik | Desain Komunikasi Visual | Film dan Animasi | Arsitektur | D3 Perhotelan , di Universitas Multimedia Nusantara. www.umn.ac.id