Sharing Session: Program Pascasarjana Universitas UCSI
Maret 14, 2022Pemula Juga Bisa Extract Data Menggunakan Pentaho Data Integration Lho!
Maret 17, 2022Tangerang – Sebagai praktisi data, R menjadi salah satu bahasa pemrograman yang harus dipahami. Banyak perusahaan besar yang menggunakan R untuk membantu mempercepat proses data statistik. Untuk memenuhi kompetensi yang diinginkan perusahaan, DQLab memberikan kesempatan bagi talenta data untuk belajar R melalui Tetris Program. Pembahasan introduction to R menjadi salah satu rangkaian Tetris Program, yang dijelaskan langsung oleh Erika Siregar selaku Co-Founder di R-Ledies Jakarta. Erika akan memaparkan seputar pengenalan R dan R Studio, cara menulis R Code untuk pertama kali dan mulai mengerjakan data menggunakan R. Sesi ini diadakan pada Senin, 14 Maret 2022, secara daring dan menjadi sesi R hari pertama.
R adalah bahasa pemrograman sekaligus software yang memungkinkan untuk melakukan pengolahan data secara statistik. R tidak hanya digunakan untuk statistik saja, namun juga support untuk berbagai tagline data science, seperti akuisisi data, exploring data, manipulasi data, visualisasi data, machine learning, pembuatan dashboard dan lain-lain. Sebagai talenta data yang mau memulai karirnya di bidang data science, R bisa menjadi salah satu langkah awal belajar data science. Selain, gratis dan open source, R juga dapat digunakan di Windows, Linux dan MacOs. Selain itu, R juga mendukung untuk visualisasi data terutama dengan menggunakan ggplot dan Shiny. Keunggulan lainnya adalah mudah dipahami, banyak komunitas R sehingga memudahkan pengerjaan ketika mengalami kesulitan, serta digunakan dalam akademik dan industri.
Berlanjut ke pembahasan R dan R Studio. Pertama Erika menyampaikan perbedaannya, menurutnya, R adalah mesinnya sedangkan R Studio adalah interfacenya. R Studio memudahkan dalam berkomunikasi dengan R, sehingga fungsi-fungsi statistika dan data science bisa berjalan. Erika mengingatkan, sebelum install R Studio, harus install R terlebih dahulu. Pada sesi ini, Erika juga memberikan pengarahan untuk membuka dan langkah pertama menggunakan R Studio.
Baca juga Tips Berkarir di Bidang Data Special untuk Non IT
Sebelum masuk ke cara menulis code R, Erika menjelaskan assigning variable’s name secara singkat. Dalam penjelasannya, nama variabel bersifat case-sensitive, tidak boleh diawali dengan angka/simbol, tidak boleh dipisah spasi, jika namanya lebih dari satu kata bisa di beri (-,_ atau .), pemberian nilai pada variabel menggunakan operator (<- atau =), tidak boleh menggunakan simbol seperti (^,!, $, @, +, =, /, % atau *:) dan yang bisa divariabelkan adalah angka, text, object, formula dan lain-lain. Langkah pertama menulis code adalah membuat file baru R dengan cara klik file, lalu new file dan klik R Script, maka akan muncul tab first_code R.
Selain itu, Erika juga mengenalkan R Package yakni koleksi dari fungsi R yang mengandung kode dan contoh sampel data. R Packages digunakan untuk memperkaya fungsionalitas R dalam mengolah data. Dalam pembahasan ini, Erika memberikan langkah-langkah untuk install, load, uninstall dan unload package. Diberikan beberapa package untuk diinstall, seperti readxl untuk memperoleh data dari excel, RMySQL untuk memperoleh data dari MySQL, mongolite untuk memperoleh data dari mongoDB, jsonlite untuk memperoleh data dari json, googlesheets4 untuk memperoleh data dari google sheets, haven dan foreign untuk memperoleh data dari SPSS, SAS serta STATA.
“Package yang menurut saya sangat penting adalah dplyr untuk manipulasi data, ggplot2 untuk visualisasi data, tidyverse sebagai universenya packages dan Shiny untuk membuat dashboard. Keempatnya juga favorite aku,” ujar Erika.
Ada dua tipe data, yakni tunggal (atomic) dan non tunggal. Untuk tipe data tunggal mengandung character, numeric, categorical, logical (boolean), integer, date, complex dan raw. Sedangkan untuk tipe data non tunggal terdiri dari vector, list, factor dan tabel. Cara untuk mendapatkan data di R adalah meluai internal dan eksternal. Jika melalui internal, bisa gunakan data yang sudah embedded di R Studio atau membuat data sendiri. Sedangkan eksternal, bisa melalui tujuh package yang sudah sebutkan Erika sebelumnya.
Setelah menjelaskan dan mempraktekkan cara mengerjakan data menggunakan R, Erika menutup pembahasan. R merupakan bahasa pemrograman yang banyak digunakan oleh praktisi data di perusahaan besar. Mulailah belajar R dengan mengenal dasarnya dan mempraktekkannya di DQLab.id.
by Lathifa Lisa – DQLab
Kuliah di Jakarta untuk jurusan program studi Informatika| Sistem Informasi | Teknik Komputer | Teknik Elektro | Teknik Fisika | Akuntansi | Manajemen| Komunikasi Strategis | Jurnalistik | Desain Komunikasi Visual | Film dan Animasi | Arsitektur | D3 Perhotelan , di Universitas Multimedia Nusantara. www.umn.ac.id