Mau Produktif? Yuk, Cobain Kerja Dari Coworking Space Paling Cozy Di Tangerang
Maret 4, 2022Belajar SQL, Keterampilan Penting untuk Praktisi Data
Maret 4, 2022Tangerang – Dalam rangka Opening Live Session Bootcamp, DQLab mengenalkan data science melalui Mini Bootcamp yang mengundang pembicara Sandi Wanda Harlan selaku Region Credit Analyst di Fifgroup member of Astra. Data science sebagai ilmu yang luas cangkupannya, meliputi matematika/statistika, ilmu komputer dan bisnis, menjadi perbincangan hangat di live session yang diadakan pada Senin, 13 Desember 2021 ini. Acara ini dilaksanakan secara daring, sehingga teman-teman bisa belajar dari mana saja.
Beberapa pembahasan yang dibawakan oleh Sandi adalah penjelasan tentang data science, perbedaan data science dan Data Scientist, alasan belajar data science, perbedaan Data Analyst, Data Scientist dan Data Engineer, serta tips dan trik belajar data science.
Data adalah sekumpulan informasi atau keterangan dari suatu hal yang diperoleh melalui pengamatan atau pencarian dari sumber tertentu. Awalnya, ilmu yang mempelajari tentang data disebut statistik. Namun, berkembangnya zaman statistik butuh suatu pengembangan lebih untuk memecahkan masalah. Muncul data science sebagai ilmu interdisiplin yang mencangkup statistika, pemrograman, dan ilmu yang berkaitan dengan bidang tertentu. Interdisiplin disini maksudnya dapat terkait dengan ilmu lain yang berkaitan dengan data.
Data science sendiri adalah ilmu yang mempelajari proses dan sistem untuk mengolah data besar menggunakan tools, dengan tujuan menemukan insight untuk membantu stakeholder membuat pilihan. Sedangkan Data Scientist adalah orang yang bertugas mengolah data menggunakan ilmu data science di sebuah perusahaan.
“Saat belajar data science, tiga ilmu dasar yakni computer science, matematika dan statistik, serta bisnis, harus dikuasai,” ujar Sandi.
Baca juga Pengenalan Data Science dalam Transformasi Digital
Ada beberapa proses dalam data science, dimulai dari mengumpulkan data, memproses data, membersihkan data, analisis data eksplorasi hingga membuat pemodelan dengan algoritma dan mengkomunikasikan data melalui visualisasi data. Untuk memberikan gambaran lifecycle data science, Sandi memberikan contoh pengaplikasian data science di beberapa bidang. Pada e-commerce, contohnya rekomendasi sistem atau menentukan tarif dan diskon. Pada bidang retail data science berperan dalam segmentasi konsumen atau market basket analysis. Pada bidang finance, data science diterapkan untuk mendeteksi kredit atau analisa kelayakan kredit. Pada social science, data science berfungsi untuk mendeteksi gambar/video atau sentiment analysis. Dan di bidang kesehatan, data science bisa digunakan untuk mendeteksi penyakit atau approval asuransi.
Menurut Sandi, data science masih dibutuhkan hingga saat ini karena masih menjadi profesi yang menjanjikan, salah satu kunci utama dalam strategi bisnis dan bisa digunakan untuk memprediksi tren di masa depan. Selain Data Scientist, data science memunculkan dua profesi lainnya yakni Data Engineer dan Data Analyst. Ketiganya berperan dalam lifecycle data science dan harus kerjasama dalam mengerjakan tugasnya.
Data Engineer bertugas mengembangkan dan membuat desain arsitektur manajemen data, serta memelihara infrastruktur data di perusahaan. Data Analyst bertanggung jawab mengolah data, mengambil kesimpulan dan visualisasi data, untuk menemukan insight dari segi bisnis. Data Scientist mempelajari tentang proses dan sistem mengolah data untuk membantu dalam pengambilan keputusan. Dalam lifecycle data science, Data Engineer berperan dalam mengumpulkan data, memproses data, membersihkan data, dan membuat produk data serta mengembalikannya ke realita. Sedangkan Data Analyst, berperan membersihkan data, menganalisis data eksplorasi, mengkomunikasikan dan memvisualisasikan data. Dan Data Scientist berperan melakukan proses data, membersihkan data, menganalisis data eksplorasi, membuat pemodelan data, mengkomunikasikan dan visualisasi data.
Sandi juga menyebutkan beberapa tools yang digunakan ketiga praktisi data tersebut. Data Engineer wajib mengusai R, Python, SQL, BigQuery dan Pentaho. Data Analyst harus bisa Spreadsheets, Tableau, Power BI, SQL dan Google Analytics. Tools yang biasa digunakan Data Scientist adalah R, Python, SQL, Machine Learning dan Java. SQL menjadi sangat penting bagi praktisi data dalam mengolah data.
Baca juga Tetris Program #StackYourSkill DQLab Hadir Berikan Beasiswa Data Science Hingga Kesempatan Berkarir
Saat belajar data science, diperlukan beberapa hard skill seperti statistika, pemograman dan pengetahuan ilmu terkait. Sedangkan soft skill yang dibutuhkan adalah rasa ingin tahu yang lebih, bisa berargumentasi dan story telling data.
“Untuk pemula, belajar statistika nya dari dasarnya saja tidak apa-apa. Karena paling banyak digunakan untuk eksplorasi data adalah yang dasar seperti nilai rata-rata, nilai maksimun, nilai minimum,” kata Sandi.
“Ilmu terkait maksudnya misal mengulik tentang retail, teman-teman harus bisa menguasai sedikitnya bidang retail. Berlaku juga bagi bidang-bidang lainnya,” tambahnya.
Sandi memberikan tips dan trik belajar data science di akhir acara, khususnya untuk pemula non IT. Pelajari dasar-dasar data science, mengikuti grup sosmed, kursus dan webinar, berani praktek, membuat portofolio dan berani mengikuti kompetisi, serta konsisten dalam belajar.
Terapkan tips dan trik belajar data science dari Sandi dengan mengikuti kursus dan berani praktek serta konsisten dalam belajar bersama DQLab.
by Lathifa Lisa | DQLab
Kuliah di Jakarta untuk jurusan program studi Informatika| Sistem Informasi | Teknik Komputer | Teknik Elektro | Teknik Fisika | Akuntansi | Manajemen| Komunikasi Strategis | Jurnalistik | Desain Komunikasi Visual | Film dan Animasi | Arsitektur | D3 Perhotelan , di Universitas Multimedia Nusantara. www.umn.ac.id