Penjelasan dan Langkah Mudah Uji Chi Square di RStudio

DW ADS

Halo sobat Exsight!

Udah lama nih Exsight nggak bahas tutorial analisis data menggunakan RStudio. Nah, kali ini Exsight akan kembali memberikan tutorial salah satu analisis data yang cukup sering digunakan untuk mengetahui ada tidaknya hubungan antara dua variabel, yaitu uji korelasi chi square. Kamu bisa baca beberapa artikel di bawah ini untuk menentukan jenis uji korelasi yang tepat berdasarkan skala dan distribusi datamu.

PENJELASAN MENGENAI UJI KORELASI

Kamu bisa juga membaca artikel berikut untuk mengetahui bagaimana cara menganalisis data menggunakan korelasi Pearson dan Spearman di RStudio.

PENJELASAN DAN LANGKAH MUDAH UJI KORELASI SPEARMAN RHO DI R STUDIO

LANGKAH MUDAH UJI KORELASI PEARSON DI R

Dasar Teori

Uji Chi Square atau yang biasa kita sebut dengan uji Kai Kuadrat adalah uji komparatif non parametris yang digunakan untuk mengetahui ada tidaknya hubungan antara dua variabel yang berskala nominal. Adapun data berskala nominal adalah data kategorik yang tidak memiliki tingkatan, misal jenis kelamin, jenis pekerjaan, kota atau daerah dan status perkawinan. Pada uji chi square akan dibuat tabel silang untuk menabulasi (menyusun dalam bentuk tabel) suatu variabel dalam kategori dan menguji hipotesis bahwa frekuensi yang diobservasi (data yang diamati) tidak berbeda dari frekuensi yang diharapkan (frekuensi teoritis). Berikut contoh tabelnya:

Pada tabel di atas, kebiasaan merokok dan status mengidap penyakit paru-paru atau tidak merupakan data berskala nominal sehingga uji chi square tepat digunakan untuk mengetahui ada tidaknya hubungan antar kedua variabel tersebut.

Syarat Uji Chi Square

Selain kedua data harus berskala nominal, ada beberapa syarat lain yang harus terpenuhi agar uji chi square dapa dilakukan.

Syarat tersebut antara lain:

  1. Tidak ada sel dengan nilai frekuensi kenyataan atau disebut juga Actual Count (F0) sebesar 0 (Nol);
  2. Apabila bentuk tabel kontingensi 2 X 2, maka tidak boleh ada 1 sel saja yang memiliki frekuensi harapan atau disebut juga expected count (“Fh”) kurang dari 5;
  3. Apabila bentuk tabel lebih dari 2 x 2, misal 2 x 3, maka jumlah sel dengan frekuensi harapan yang kurang dari 5 tidak boleh lebih dari 20%.

Langkah Pengujian Chi Square

Adapun langkah – langkah dalam pengujian Chi-square yaitu :

  • Merumuskan hipotesis H0 dan H1

H0 : Tidak terdapat hubungan yang signifikan antara dua variabel
H1 : Terdapat hubungan yang signifikan antara dua variabel

  • Menetapkan alpha atau taraf signifikansi (umumnya menggunakan alpha 5%)
  • Menghitung statistik uji

Uji Chi-square dapat dirumuskan sebagai berikut:

di mana
X^{2} = Distribusi Chi-square
Oi = Nilai observasi (pengamatan) ke-i
Ei = Nilai ekspektasi ke-i = \frac{\left ( Total Baris \right )\left ( Total Kolom \right )}{Total Keseluruhan}

Rumus pada uji Chi–square sebenarnya tidak hanya ada satu. Apabila pada tabel kontingensi 2 X 2 maka rumus yang digunakan adalah Continuty Correction. Apabila tabel kontingensi 2 X 2, tetapi tidak memenuhi syarat dalam uji Chi-square maka rumus yang digunakan adalah Fisher Exact Test. Sedangkan apabila tabel kontingensi lebih dari 2 X 2 misal 2 X 3 maka rumus yang digunakan adalah Pearson Chi-square (Supranto, 2000).

  • Menentukan kriteria uji

H0 ditolak jika p-value < alpha. Atau bisa juga menggunakan kriteria nilai chi square sebagai berikut:

H0 ditolak jika Langkah Analisis di RStudio

Misal ingin diketahui apakah terdapat hubungan antara Jenis Kelamin dan Status Keterlibatan dalam Kerja Bakti di suatu kecamatan. Karena kedua indikator tersebut merupakan data berskala nominal, maka uji chi square adalah uji yang tepat untuk mengetahui ada tidaknya hubungan antara dua variabel tersebut.

Data yang digunakan dalam tahap analisis dapat di-download di sini

Langkah pertama yang harus dilakukan saat akan melakukan analisis data menggunakan R adalah melakukan input data. Banyak cara yang dapat dilakukan untuk mengimpor data, disini saya menggunakan sintaks read_excel yang terdapat pada library (readxl)

#Input Data
library(readxl) #Mengaktifkan library readxl
data=read_excel(file.choose()) #Memilih file yang akan dianalisis

Setelah sintaks tersebut di-run, silahkan pilih data yang akan dianalisis. Jangan lupa untuk menyimpan data dalam format .xlsx jika ingin menggunakan sintaks read_excel.

Untuk mengecek apakah data telah diinput secara benar, kita dapat mengetikkan sintaks berikut.

View(data)

Maka data akan terlihat sebagai berikut.

Tampilan Data untuk Uji Chi Square

Data tersebut terdiri dari 99 baris dan 2 kolom. Artinya, ada 99 sampel yang digunakan pada data tersebut.

Sebelum dilakukan uji korelasi, maka kita harus melakukan pengecekan syarat apakah data tersebut dapa dianalisis menggunakan uji chi square. Pengecekan dapat dilakukan dengan membuat tabel kontingensi menggunakan command berikut.

table(data$Jenis_Kelamin, data$Kerja_Bakti)

Berikut tabel yang dihasilkan.

> table(data$Jenis_Kelamin, data$Kerja_Bakti)

Terlibat Tidak
Laki-laki 41 6
Perempuan 18 34

Dari output di atas diketahui bahwa tidak ada sel yang berisi nilai 0. Untuk mengecek berapa nilai frekuensi harapan dari setiap sel, kamu dapat melihat hasil perhitungan di bawah ini.

Langkah pertama yang harus kamu lakukan adalah menjumlahkan setiap baris dan kolom dari tabel kontingensi. Kamu bisa menambahkan kolom dan baris total pada tabel.

Kemudian hitung frekuensi harapan menggunakan rumus  berikut:

E_{i}=\frac{\left ( Total Baris \right )\left ( Total Kolom \right )}{Total Keseluruhan}

Dari tabel tersebut, diperoleh hasil bahwa tidak ada frekuensi harapan yang bernilai kurang dari 5 sehingga uji chi square dapat dilakukan.

> #uji Chi Square
> chisq.test(table(data$Jenis_Kelamin, data$Kerja_Bakti))

Pearson's Chi-squared test with Yates' continuity correction

data: table(data$Jenis_Kelamin, data$Kerja_Bakti)
X-squared = 26.243, df = 1, p-value = 3.011e-07

Hipotesis:

H0 : Tidak terdapat hubungan yang signifikan antara jenis kelamin dan status keterlibatan dalam kerja bakti

H1 : Terdapat hubungan yang signifikan antara jenis kelamin dan status keterlibatan dalam kerja bakti

Berdasarkan uji hipotesis dan cara penarikan kesimpulan seperti yang telah dijelaskan sebelumnya, kita memperoleh informasi bahwa pada taraf signifikansi 5%, terdapat terdapat hubungan yang signifikan antara jenis kelamin dan status keterlibatan dalam kerja bakti. Hal ini dikarenakan p-value yang diperoleh sebesar 0.0000003011 < 0.05 sehingga H0 ditolak.

Nah, sekian dulu penjelasan mengenai uji Korelasi Chi Square. Jika kamu ada request metode apalagi yang ingin dibahas Exsight pada artikel selanjutnya, bisa langsung tulis di kolom komentar yaaa. Atau bisa langsung bertanya kepada admin Exsight melalui tombol whatsapp di pojok kanan bawah.

See you in the next article and have a nice day!

Referensi

Negara I.C. & A. Prabowo. 2018. Penggunaan Uji Chi–Square untuk Mengetahui Pengaruh Tingkat Pendidikan dan Umur terhadap Pengetahuan Penasun Mengenai Hiv–Aids di Provinsi DKI Jakarta. Prosiding Seminar Nasional Matematika dan Terapannya, Purwokerto: 15 September 2018.

Supranto, J., Statistik Teori dan Aplikasi, Erlangga, Jakarta, 2000.

Sstt...
Mau Kiriman Artikel Terbaru Exsight
Tanpa Biaya Langganan? ????

Nama Kamu

Email Kamu

Dapatkan Akses Informasi Terupdate Seputar Dunia Data dan Statistika 🙂

Exsight ADS

1 thought on “Penjelasan dan Langkah Mudah Uji Chi Square di RStudio”

  1. Pingback: Feature Selection In Data Mining - Exsight

Leave a Comment

Hubungi Admin
Halo, selamat datang di Exsight! 👋

Hari ini kita ada DISKON 20% untuk semua transaksi. Klaim sekarang!