Mahasiswa NON IT, Yuk Kenali Data Quality Agar Datamu Akurat
April 14, 2022Tim Perwakilan Silla University Melakukan Monitoring dan Evaluation Visit KOICA di UMN
April 21, 2022Tangerang – R adalah bahasa pemrograman sekaligus software yang berfokus pada pengolahan data dan grafik. R menjadi salah satu bahasa pemrograman yang populer karena memiliki jumlah fitur yang banyak. Maka dari itu, DQLab bersama dengan Kominfo mengadakan live session dengan materi R Fundamental for Data Science. Yang memaparkan materi tersebut adalah Shella Theresya Pandiangan selaku Data Scientist di United Tractor. Live session ini diadakan secara daring oleh DQLab dan Kominfo, pada Jumat, 11 Maret 2022.
Dimulai dengan data team yang terdiri dari Data Scientist, Data Engineers dan Data Analyst. Menurut Shella yang membedakan ketiganya adalah pada tugas yang dikerjakan. Data Scientist bertugas mulai dari packing data hingga melakukan modeling dan menemukan insight. Untuk skill dasar yang dibutuhkan Data Scientist adalah matematika, programing (SQL, R dan Python) dan komunikasi. Seorang Data Scientist harus menguasai data managers dan statistik.
Data Engineer diibaratkan arsitek data atau seseorang yang membangun data. Data Engineer bertugas mulai dari merapikan data warehouse, membangun kerangkanya, hingga melihat hubungan antara tabel pertama dan kedua. Skill yang harus dikuasai Data Engineer adalah programing (Hadoop, MySQL dan Python), matematika dan big data. Seorang Data Engineer harus bisa menguasai administrasi database dan arsitek data.
Data Analyst lebih banyak bertugas pada visual atau analisis yang bersifat short term dan digunakan untuk membangun dashboard. Yang dibutuhkan dalam Data Analyst adalah skill statistik, komunikasi, pengetahuan bisnis dan bahasa pemrograman (Excel, Tableau, SQL dan R). Lebih unggul jika seorang Data Analyst bisa menguasai bisnis analysis juga.
“Praktisi data di perusahaan A, belum tentu jobnya sama dengan praktisi data di perusahaan B,” ujar Shella.
Baca juga Webinar DQLab x Shopee: Mengenal SQL pada Business Analytics untuk Mahasiswa
Selanjutnya Shella memberikan sekilas materi tentang type statistik software. Ada tiga tipe, yakni command-line software, GUI-based software dan hybrid types. Type hybrid terkandung dalam R dan menjadi alasan R digunakan dalam pembelajaran kali ini. Beberapa contoh statistik software, seperti SAS, SPSS, Minitab, Statgraphics, S-Plus dan R.
Dijelaskan lebih lanjut oleh Shella alasan menggunakan R dalam pembelajaran kali ini adalah karena R bersifat free, top quality, tersedia di semua platform dan mengandung improvement kedepannya.
Dasar-dasar statistik pada R, yaitu summary, mean, stdev, t.test dan boxplot. Dalam R ada beberapa package, untuk memilih package bisa menggunakan Load Packages, seperti qcc (quality control) atau survival. Di R juga terdapat beberapa function yang merupakan perintah R yang memiliki dan menerima beberapa nilai teks maupun angka sebagai parameternya.
Pada sesi ini, Shella hanya memperkenalkan dasar-dasarnya saja. Untuk lebih dalamnya ia akan menjelaskan di sesi selanjutnya, yakni Statistik with R.
R yang bersifat open source, memudahkan pemula atau mahasiswa dalam mempelajari bahasa pemrograman ini. Sebagai fondasi memulai karir di ranah data, R menjadi sangat penting untuk dipelajari. Awali karirmu bersama DQLab.
*by Agnes Nurlisa | DQLab
Kuliah di Jakarta untuk jurusan program studi Informatika| Sistem Informasi | Teknik Komputer | Teknik Elektro | Teknik Fisika | Akuntansi | Manajemen| Komunikasi Strategis | Jurnalistik | Desain Komunikasi Visual | Film dan Animasi | Arsitektur | D3 Perhotelan , di Universitas Multimedia Nusantara. www.umn.ac.id