Analisis Korelasi Kanonikal dengan R Studio (Tutorial 7 Menit)

DW ADS

Halo halo sobat Exsight. Statistika sebagai suatu bidang keilmuan yang berkaitan dengan data, tentunya memiliki beragam metode analisis data. Salah satu pengembangan dari ilmu statistika yang berperan dalam mengetahui hubungan antar variabel yaitu analisis korelasi. Adapun pada artikel kali ini, metode yang dibahas berfokus pada pembahasan analisis korelasi secara multivariat, yaitu korelasi kanonikal menggunakan software R Studio.

Analisis Korelasi Kanonikal

Definisi

Analisis Korelasi Kanonikal merupakan suatu analisis statistik multivariat yang digunakan untuk mengidentifikasi keterkaitan hubungan antara dua kelompok variabel secara bersamaan, yaitu kelompok variabel y (terdiri atas beberapa variabel dependen) serta kelompok variabel x (terdiri atas beberapa variabel independen). Adapun persamaan umum untuk analisis korelasi kanonikal adalah sebagai berikut.

Analisis Korelasi Kanonikal
Gambar 1. Persamaan Umum Korelasi Kanonikal

Berdasarkan Gambar 1, diketahui bahwa untuk kelompok variabel dependen maupun kelompok variabel independen dapat berupa data berskala metrik maupun skala non metrik.

Tahapan R Studio

Artikel ini akan membahas tentang tutorial Analisis Korelasi Kanonikal dengan R Studio. Adapun studi kasus yang digunakan dalam hal ini menggunakan data Red Wine Quality, yang didapatkan dari situs dataset UCI Machine Learning Repository.
* Data terdiri atas 12 variabel dan 1599 observasi.
* Tidak terdapat missing value pada data.

Berdasarkan 12 variabel yang tersedia, selanjutnya dilakukan data cleaning dengan hanya mengambil 7 variabel saja yaitu chlorides, free sulfur dioxide, total sulfur dioxide, fixed acidity, volatile acidity, citric acid, dan density.

Analisis Korelasi Kanonikal
Gambar 2. Data Red Wine Analisis Korelasi Kanonikal

Kemudian dari 7 variabel tersebut akan dikelompokkan dalam 2 grup, untuk grup 1 dinamai ide dan untuk grup 2 dinamai acidity. Adapun untuk pengelompokkan variabel masing-masing grup adalah sebagai berikut.

  • Grup 1 : chlorides, free sulfur dioxide, dan total sulfur dioxide (3 Variabel)
  • Grup 2 : fixed acidity, volatile acidity, citric acid, dan density (4 variabel)

Load Package

Tahapan paling awal sebelum running syntax di software R Studio yaitu melakukan load package R Studio . Adapun package yang diperlukan untuk analisis korelasi kanonikal yaitu lme4, CCA, dan CCP. Syntax R Studio yang digunakan yaitu:

library(lme4)
library(CCA)
library(CCP)

Load Data

Kemudian melakukan input data ke R Studio. Data yang diinput diberi nama sebagai pole. Perlu diperhatikan untuk jenis file data yang diinput ke R Studio diusahakan dalam format CSV, hal ini dengan tujuan untuk mempermudah pengguna. Syntax yang digunakan adalah sebagai berikut.

pole<-read.csv(file.choose(),header=TRUE,sep=",")

Data yang sudah diinput, selanjutnya dikelompokkan menjadi 2 grup, dalam hal ini grup 1 diberi nama ide sedangkan grup 2 diberi nama acidity. Syntax R yang digunakan adalah sebagai berikut.

ide<-pole[,1:3]
acidity<-pole[,4:7]

Matriks Korelasi

Tahapan berikutnya yaitu menghitung korelasi untuk masing-masing variabel, dalam hal ini terdiri atas korelasi antar variabel di grup 1 dan korelasi antar variabel di grup 2. Syntax yang digunakan adalah sebagai berikut.

cormat<-matcor(ide,acidity)
cormat
Gambar 3. Output R Matriks Korelasi Variabel di Grup 1

Gambar 3. memperlihatkan bahwa pada grup 1, variabel free.sulfur.dioxide dan variabel total.sulfur.dioxide memiliki korelasi yang cukup tinggi sebesar 0,66766645. Korelasi ini bernilai positif, hal ini menunjukkan bahwa semakin meningkatkanya zat free.sulfur.dioxide maka akan meningkatkan nilai total.sulfur.dioxide begitu pula sebaliknya.

Gambar 4. Output R Matriks Korelasi Variabel di Grup 2

Matriks korelasi pada Gambar 4. memperlihatkan bahwa pada grup 2, variabel citric.acid dan variabel fixed.acidity memiliki korelasi yang cukup tinggi sebesar 0,6717034. Korelasi ini bernilai positif, hal ini menunjukkan bahwa semakin meningkatkanya nilai citric.acid maka akan meningkatkan nilai fixed.acidity begitu pula sebaliknya.

Korelasi Kanonikal

Korelasi kanonikal antar variat kanonik memiliki interpretasi sama dengan korelasi biasa. Apabila nilai korelasi kanonikal semakin mendekati 1, maka menunjukkan hubungan antar variat kanonik yang semakin kuat, sedangkan jika nilainya semakin mendekati 0, maka hubungan antar variat kanonik yang semakin lemah. 

#Obtaining the Canonical Correlations
can_corl=cc(ide,acidity)
can_corl$cor
Gambar 5. Nilai Korelasi Kanonikal

Berdasarkan Gambar 5. terlihat bahwa perhitungan korelasi kanonikal antara grup 1 (ide) dan grup 2 (acidity) membentuk 3 dimensi. Nilai-nilai korelasi kanonikal dari ketiga dimensi tersebut menunjukkan nilai yang mendekati 0, sehingga dapat dikatakan hubungan antar variat kanonik pada ketiga dimensi tersebut agak lemah.

#raw canonical coefficients
can_corl[3:4]
Gambar 6. Output R Koefisien Raw Canonical

Berdasarkan nilai koefisien raw canonical pada Grup 2 acidity (ycoef),

  • Misalnya kita ingin mencari tahu pengaruh fixed.acidity pada varian kanonik pertama untuk himpunan yang bersangkutan (nilainya yaitu 0,6300078) interpretasinya yaitu : Setiap peningkatan fixed.acidity sebesar 1 unit maka akan menghasilkan peningkatan sebesar 0,6300078 unit pada nilai varian kanonik pertama (dimensi pertama) untuk grup 2 acidity, dimana untuk variabel lainnya dianggap konstan.
  • Kemudian misalnya untuk mengetahui pengaruh volatile.acidity pada dimensi 2 (nilainya yaitu 2,7250334) interpretasinya yaitu: Setiap peningkatan volatile acidity sebesar 1 satuan akan meningkatkan 2,7250334 unit pada nilai varian kanonik kedua (dimensi kedua) untuk grup 2 acidity, dimana untuk variabel lainnya dianggap konstan.

Nilai Loadings Kanonikal

Nilai Loadings Kanonikal digunakan untuk menunjukkan korelasi antar variabel kanonikal dengan variabel-variabel penyusunnya (variabel asal). Semakin besar nilai loadings kanonikal maka semakin dekat hubungan fungsi kanonikal yang bersangkutan dengan variabel asal.

#Compute the canonical loadings
can_cor2=comput(ide,acidity,can_corl)
can_cor2[3:6] #displays the canonical loadings
Gambar 7. Nilai Loadings Kanonikal

Uji Wilks’ Lambda

Selanjutnya melakukan perhitungan statistik uji pada dimensi yang terbentuk pada analisis korelasi kanonikal. Pengujian dilakukan menggunakan metode Wilks’ Lambda, dimana dalam hal ini nilai taraf signifikansi yang digunakan yaitu sebesar 5% atau 0,05. Syntax beserta output R Studio yang didapatkan adalah sebagai berikut.

#Test of Canonical Dimensions
rho=can_corl$cor
#defining the number of observations, and number of variables in second set
n=dim(ide)[1]
p=length(ide)
q=length(acidity)
#Calculating the F approximations using different test statistics
#Using Wilk Test Statistics
p.asym(rho,n,p,q,tstat = "Wilks")
Gambar 8. Statistik Uji Wilks’ Lambda

Gambar 8. menampilkan informasi terkait nilai signifikansi dari dimensi analisis kanonikal (dimensi 1,2, dan 3). Dalam hal ini apabila dimensi 1 hingga 3 digabungkan keseluruhan, terlihat bahwa p-value nya (0,000000e+00) bernilai kurang dari taraf signifikansi (0,05). Artinya gabungan antara dimensi 1 hingga dimensi 3 pada korelasi kanonikal signifikan secara statistik.

Pada hasil pengujian ke-2 (gabungan antara dimensi 2 dan 3) juga memiliki p-value yang bernilai kurang dari 0,05. Artinya gabungan antara dimensi 2 dan 3 pada korelasi kanonikal signifikan secara statistik.

Namun pada pengujian ke 3 (dimensi 3 saja) memiliki memiliki p-value yang bernilai lebih dari 0,05. Artinya dimensi 3 pada korelasi kanonikal tidak signifikan secara statistik.

Standarisasi Koefisien Korelasi Kanonikal

Prosedur standarisasi dilakukan untuk mempermudah dalam melakukan perbandingan antar variabel, dalam hal ini dikarenakan adanya perbedaan skala antar variabel serta nilai standar deviasi antar variabel terlalu besar. Adapun nilai standardized coefficient akan menunjukkan kontribusi dari masing-masing variabel terhadap pembentukan variat kanonik. Berikut untuk syntax beserta output R untuk standarisasi koefisien korelasi kanonikal.

#Standardizing the first set of canonical coefficients (ide)
std_coef1<-diag(sqrt(diag(cov(ide))))
std_coef1%*%can_corl$xcoef
Gambar 9. Koefisien Korelasi Kanonikal Terstandarisasi (Grup 1)

Pada Gambar 9. untuk [1,] menunjukkan variabel chlorides, [2,] menunjukkan variabel free sulfur dioxide , dan [3,] menunjukkan variabel total sulfur dioxide.

Interpetasi untuk hasil output pada Gambar 9. yaitu misalnya, dalam grup 1 (ide), nilai chlorides pada dimensi pertama sebesar -0,7249126. Artinya satu unit peningkatan nilai chlorides akan menghasilkan peningkatan standar deviasi sebesar -0,7249126 unit pada varian kanonik pertama (dimensi pertama), dimana semua variabel lain dalam model dianggap konstan.

#Standardizing the coeficients of the second set (acidity)
std_coef2<-diag(sqrt(diag(cov(acidity))))
std_coef2%*%can_corl$ycoef
Gambar 10. Koefisien Korelasi Kanonikal Terstandarisasi (Grup 2)

Pada Gambar 10. untuk [1,] menunjukkan variabel fixed acidity, [2,] menunjukkan variabel volatile acidity, [3,] menunjukkan variabel citrid acid, dan [4,] menunjukkan variabel acidity.

Interpetasi untuk hasil output pada Gambar 10. yaitu misalnya, dalam grup 2 (acidity), nilai fixed acidity pada dimensi pertama sebesar 1,0969042. Artinya satu unit peningkatan nilai fixed acidity akan menghasilkan peningkatan standar deviasi sebesar 1,0969042 unit pada varian kanonik pertama (dimensi pertama), dimana semua variabel lain dalam model dianggap konstan.

Demikian penjelasan tutorial Analisis Korelasi Kanonikal dengan R Studio. Apabila masih ada yang dibingungkan bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya.

Referensi

Hair, J., Black, W., Babin, B., & Anderson, R. (2009). Multivariate Data Analysis Seventh Edition. Pearson.

González, I., Déjean, S., Martin, P. G., & Baccini, A. (2008). CCA: An R package to extend canonical correlation analysis. Journal of Statistical Software23(12), 1–14.

Sstt...
Mau Kiriman Artikel Terbaru Exsight
Tanpa Biaya Langganan? ????

Nama Kamu

Email Kamu

Dapatkan Akses Informasi Terupdate Seputar Dunia Data dan Statistika 🙂

Exsight ADS

Leave a Comment

Hubungi Admin
Halo, selamat datang di Exsight! 👋

Hari ini kita ada DISKON 20% untuk semua transaksi. Klaim sekarang!