Kuliah Tamu: Komunikasi Untuk Pembangunan Berkelanjutan
Maret 10, 2022Sharing Session: Program Pascasarjana Universitas UCSI
Maret 14, 2022Tangerang – Tetris Program merupakan salah satu upaya DQLab dalam mendukung generasi muda untuk menjadi talenta data yang kompeten. Menyambung pembahasan ETL di sesi pertama, dalam sesi keduanya DQLab memberikan materi pemahaman tentang Pentaho Data Integration (PDI). Materi ini akan dibawakan oleh pembicara yang sama, yakni Iqbal Hanif selaku Big Data Analytics di Telkom Indonesia. Beberapa sub materi yang akan dijelaskan Iqbal adalah pengertian Pentaho Data Integration, pemahaman set up yang diperlukan saat menggunakan PDI dan panduan membuat transformasi dan job menggunakan PDI. Acara ini diadakan pada Jumat, 4 Maret 2022, secara daring.
Pentaho adalah software Business Intelligence (BI) yang menyediakan data integrasi, pelayanan OLAP, reporting, dashboarding, data mining dan kemampuan ETL. Pentaho Data Integration atau Kettle adalah software dari Pentaho yang digunakan untuk proses ETL (Extraction, Transformation dan Load). PDI dapat digunakan untuk migrasi data, membersihkan data, loading dari file ke database atau sebaliknya dalam volume besar. Keunggulan PDI adalah tersedia graphical user interface dan drag-drop komponen yang dapat memudahkan user. Pentaho Data Integration memiliki tiga komponen utama, yakni spoon, pan dan kitchen. Spoon adalah user interface untuk membuat job dan transformation, kemudian pan itu program yang mengeksekusi transform dan kitchen merupakan program yang mengeksekusi job.
Transformation adalah komponen dari PDI berupa rancangan transformasi yang disusun untuk melakukan proses ETL. Ciri-cirinya, terdiri dari step (berisikan tugas-tugas), dieksekusi oleh pan (pan.bat atau pan.sh) dan format filenya (.ktr). Selanjutnya Job adalah komponen dari PDI yang menangani kontrol atas aliran tugas atau transformasi. Job memiliki ciri-ciri, bisa terdiri dari satu atau beberapa transformation dan job lain, dieksekkusi oleh kitchen (kitchen.bat atau kitchen.sh) dan format filenya (.kjb).
“Di transformation kita bisa mengambil data, membersihkan data atau transform data lalu load,” ujar Iqbal.
Baca juga Mahasiswa Bisa Manfaatkan Data-Driven Digital Marketing untuk Sosial Media
Iqbal memberi panduan untuk pengguna Windows dalam download PDI. Pertama pastikan sudah download dan install Java, serta tambahkan ke environment variable. Kedua extract “data-integration” dari file “pdi-ce” yang di download. Iqbal menambah catatan, saat mengakses DB MySQL, perlu menambahkan mysql-connector-java.jar ke dalam folder “lib” di “data-integration”. Iqbal merekomendasikan untuk training menggunakan versi 8/9 karena terbaru namun lebih berat, sedangkan versi 5 jadul tapi ringan.
Untuk pengguna MacOS, panduan yang diberikan Iqbal adalah pertama pastikan sudah mendownload dan install Java, serta tambahkan ke environment variable. Untuk catatan, dalam mengakses DB MySQL, perlu menambahkan mysql-connector-java.jar ke dalam folder “lib” di “data integration”. Dilanjutkan dengan penjelasan Iqbal tentang tampilan dan fitur yang ada di Pentaho, serta pengoperasian Pentaho.
Materi yang ketiga, Iqbal memaparkan panduan membuat transformation dan job di PDI. Yang pertama membuat transformation dengan goal membuat teks file berisikan “Hello World!”, dibutuhkan data grid lalu text file output. Yang kedua membuat job dengan goal membuat pop up notification berisikan “Hello World!”, dengan steps start lalu display msgbox info.
Materi ketiga tadi menjadi penutup pembahasan Iqbal. Untuk memahami lebih lanjut DQLab memberikan beberapa rangkaian lagi yang harus ditempuh talenta data dalam belajar data science. Coba panduan belajar data science melalui program seru DQLab.id.
by Lathifa Lisa