Membuat Plot Visualisasi dengan Library Esquisse di R
Visualisasi data adalah salah satu tahapan yang dilakukan dalam eksplorasi data di mana tujuannya adalah untuk memudahkan peneliti atau siapa saja dalam menggali informasi tersirat yang terdapat di dalam data. Visualisasi ini dapat digunakan untuk mepresentasikan informasi yang ada di dalam data dalam bentuk grafik maupun bagan. Visualisasi data penting dilakukan karena akan membuat siapa saja dapat memahami insight yang ada pada data dengan mudah dan cepat. Seperti yang kita tahu, otak manusia lebih mudah mencerna dan mengingat informasi visual dibandingkan kata.
Ada banyak tool yang dapat digunakan untuk melakukan visualisasi analisis data. Ada tool yang berbasis GUI seperti Excel, Tableau, Power BI dan Google Data Studio. Namun ada juga tool lain berbasis code seperti R dan Python. R dan Python memiliki berbagai library yang dapat digunakan untuk melakukan berbagai jenis visualisasi data sesuai kebutuhan.
Namun ternyata, para kontributor R telah mengembangkan GUI untuk melakukan visualisasi data tanpa code. Kali ini Exsight akan membahas lebih lanjut bagaimana cara membuat visualisasi data tersebut tanpa menggunakan code di software R
About R
R adalah aplikasi Open Source yang digunakan secara masif untuk kegunaan statistik dan representasi grafik. R dikembangkan oleh Ross lhaka dan Robert Gentleman pada tahun 1993. Kamu bisa baca selengkapnya tentang R disini.
Dari definisi di atas, jelas bahwa R dapat digunakan untuk membuat visualisasi data. Namun terkadang pembuatan grafik pada R yang membutuhkan suatu kode membuat peneliti yang tidak memiliki background STEM (Science, Technology, Engineering & Mathematics) cukup kewalahan dalam mengoperasikannya. Peneliti harus memahami terlebih dahulu dokumentasi dari library yang digunakan dan membangun kode secara detil dan teliti untuk memperoleh grafik yang diinginkan.
Kabar baiknya, para kontributor R ternyata telah membuat suatu GUI yang dapat digunakan oleh siapa saja untuk memvisualisasikan data secara gratis. Kamu tidak perlu lagi mempelajari dokumentasi kode yang akan digunakan karena pada GUI ini kamu bisa memanfaatkan fitur “drag and drop” untuk melakukan visulisasi data. Adapun library tersebut adalah esquisse.
Esquisse
Esquisse adalah library R yang dapat kamu gunakan untuk melakukan visualisasi data tanpa code. Kamu dapat menggunakan fitur “drag and drop” sama seperti tools visualisasi pada umumnya untuk membuat plot atau sebagainya. Library esquisse ini mengkombinasikan library ggplot2 dan dplyr untuk menghasilkan visualisasi data yang menarik. Kamu dapat mengatur tema plot, judul, label, warna dan berbagai bagian lain pada plot tanpa sama sekali menuliskan code.
Instalasi di R
Instalasi library Esquisse di R sama halnya dengan instalasi package lainnya.
Kamu dapat menuliskan kode berikut untuk melakukan instalasi di R dari CRAN.
install.packages("esquisse")
Atau kode berikut jika ingin melakukan instalasi langsung dari github.
remotes::install_github("dreamRs/esquisse")
Cara Menggunakan Esquisse
Aktivasi GUI
Setelah library berhasil diinstall, kamu dapat langsung mengaktifkan dan menggunakan GUI tersebut menggunkan kode berikut.
library(esquisse) esquisser()
Setelah dirunning, GUI tersebut akan muncul pada web browser default dari PC mu. Berikut tampilan awal GUI yang muncul pada Microsoft Edge jika kamu belum mendefinisikan sumber data yang akan dibuat visualisasi.
Import Data
Ada dua cara yang dapat kamu lakukan untuk melakukan import data di GUI tersebut. Pada artikel kali ini, akan digunakan data yang sebelumnya sudah pernah digunakan sebagai bahan analisis regresi logistik ordinal. Kamu dapat mendownload data tersebut di sini.
Langkah pertama adalah tentu melakukan import data pada environment R. Banyak cara yang dapat dilakukan untuk mengimport data, disini saya menggunakan sintaks read_excel yang terdapat pada library (readxl)
#Input Data library(readxl) #Mengaktifkan library readxl data=read_excel(file.choose()) #Memilih file yang akan dianalisis
Setelah sintaks tersebut di-run, silahkan pilih data yang akan dianalisis. Jangan lupa untuk menyimpan data dalam format .xlsx jika ingin menggunakan sintaks read_excel.
Untuk mengecek apakah data telah diinput secara benar, kita dapat mengetikkan sintaks berikut.
#melihat tampilan data
View(data)
Jika data yang diinput telah sesuai, maka lanjutkan dengan menuliskan kode berikut untuk menginput data ke dalam GUI Esquisse.
esquisser(data)
Nama dataframe yang ada di dalam tanda kurung disesuaikan dengan nama dataframe yang telah kamu input. Misal nama dataframe tersebut adalah data_contoh, maka ketikkan esquisser(data_contoh).
Berikut tampilan GUI setelah menjalankan kode di atas.
Secara langsung GUI akan menampilkan kanvas untuk melakukan visualisasi data seperti di atas.
Namun, jika kamu ingin mendefinisikan terlebih dahulu skala data dari variabel yang kamu gunakan, dan tidak hanya satu data frame yang akan digunakan untuk visualisasi data, kamu dapat melakukannya dengan kode berikut.
esquisser()
Kemudian akan muncul tampilan sebagai berikut.
Pilih dataframe yang akan digunakan pada sel “Choose a data.frame“. Perlu diingat bahwa dataframe yang dapat dipilih hanya dataframe yang sudah diinput pada environment R.
Karena hanya ada satu dataframe yang diinput, maka hanya akan muncul satu dataframe tersebut.
Kamu dapat menentukan variabel mana saja yang akan digunakan untuk visualisasi pada sel “Select variables to keep” dengan mengklik tanda centang. Kamu juga dapat mengetahui skala data serta status missing values dari data yang kamu gunakan.
Jika ingin mengubah skala data, kamu dapat melakukannya pada bagian “Choose a variable to coerce“.
Misal kamu ingin mengubah variabel gender yang semula berskala numerik menjadi faktor, kamu dapat melakukannya seperti gambar di atas. Kemudian klik “Coerce“. Kamu juga dapat melakukan hal yang sama untuk variabel lainnya.
Jika semua variabel telah diatur sesuai keinginanmu, maka jangan lupa untuk mengklik “Validate Imported Data“.
Dari tampilan di atas terlihat bahwa dataframe terdiri dari empat variabel. Adapun variabel biru adalah variabel berskala numerik, sedangkan yang berwarna merah adalah variabel berskala kategorik.
Visualisasi Data
Untuk melakukan visualisasi data, kamu dapat melakukannya dengan memindahkan variabel yang akan divisualisasikan ke kolom X dan Y. Kamu juga dapat mengatur warna dari setiap kategori dengan menggunakan kolom fill dan color.
Secara otomatis GUI akan merekomendasikan plot yang sesuai dengan skala dari data yang kita gunakan.
Kamu dapat memilih plot yang lain dengan mengklik gambar histogram di kiri atas.
Berikut plot lainnya yang dihasilkan jika memindahkan variabel gender ke kolom Y.
Kamu juga dapat mengatur warna serta melakukan grouping dengan mudah melalui GUI ini.
Menu Kontrol
Selain dapat digunakan untuk melakukan visualisasi data seperti di atas, esquisse juga menyediakan empat menu lainnya yang dapat digunakan untuk mempercantik tampilan visualisasi datamu. GUI ini juga menggenerate kode yang nantinya dapat kamu gunakan sebagai source code jika ingin melakukan visualisasi data tanpa library esquisse.
Labels & Title
Menu ini memungkinkan kamu untuk mengatur judul plot, subtitle, keterangan dan judul pada sumbu X dan Y.
Plot options
Di sini kamu dapat memodifikasi warna serta tema yang akan digunakan pada plot.
Data
Menu untuk memfilter data yang digunakan dalam plot secara interaktif.
Export & code
Dalam menu ini, kamu dapat mengambil kode yang digunakan untuk menghasilkan plot, serta kode yang digunakan untuk memfilter data. Kamu dapat menyalin kode ke clipboard, atau memasukkannya ke dalam skrip R lain.
Di menu ini, kamu juga bisa mengexport plot yang telah dibuat ke dalam file .png atau .pptx
Berikut contoh hasil visualisasi setelah dilakukan editing menggunakan menu-menu tersebut.
Dan berikut kode yang dihasilkan.
ggplot(data) +
aes(x = gender, y = age, fill = gender) +
geom_boxplot() +
scale_fill_brewer(palette = "RdYlBu") +
labs(title = "Boxplot of Age by Gender and Marrital Status") +
theme_ft_rc() +
facet_wrap(vars(married))
Penutup
Nah, mudah banget kan cara visualisasi data menggunakan Esquisse di R. Kamu tidak perlu repot-repot menuliskan kode atau melakukan instalasi aplikasi lainnya untuk melakukan visualisasi data. Kamu bisa explore lebih lanjut terkait plot apa saja yang bisa dihasilkan dari GUI tersebut. Atau jika kamu masih penasaran dengan fitur lainnya yang ada di GUI tersebut, jangan sungkan untuk bertanya di kolom komentar atau menghubungi admin melalui tombol WA.
See you di artikel selanjutnya!
Membuat Plot Visualisasi dengan Library Esquisse di R Read More »