chi- square

Distribusi Chi-Square: Serba-Serbi Distribusi

DW ADS

Chi-Square — Halo halo sobat Exsight, dalam artikel kali ini kita akan membahas lebih dalam terkait Distribusi Chi-Square, diantaranya meliputi Konsep Dasar, Kelebihan dan Kelemahan, Contoh Penggunaan Distribusi Chi-Square, Pengembangan Distribusi Chi-Square dalam Pemodelan Statistik, serta Contoh Soal Penerapannya. Yuk yuk simak artikel ini dengan seksama yaa!

Konsep Dasar

Distribusi chi-square adalah distribusi probabilitas yang banyak digunakan dalam statistik, terutama dalam uji hipotesis dan analisis varians. Peluang suatu nilai tertentu muncul dalam distribusi Chi-Square digambarkan melalui Probability Density Function (PDF). Adapun rumus Probability Density Function untuk distribusi Chi-Square adalah sebagai berikut.

 f\left ( x;v \right )=\frac{1}{2^{\frac{v}{2}}\Gamma \left ( \frac{v}{2} \right )}x^{\frac{v}{2}-1}e^{\frac{-x}{2}}
chi- square
Gambar 1. Grafik Distribusi Chi-Square

Gambar 1 di atas menunjukkan grafik dari distribusi Chi-Square dengan berbagai derajat bebas (df) diantaranya meliputi derajat bebas 1, 5, 10, dan 20. Bentuk kurva distribusi chi-square berubah sesuai dengan derajat bebas (df).

  • Semakin kecil derajat bebas (df):
    Distribusi lebih miring ke kanan dengan puncak semakin mendekati nol.
  • Semakin besar derajat bebas (df):
    Distribusi nya lebih tersebar serta condong ke kanan, lalu semakin besar derajat besar (df) maka distribusi menjadi lebih mendekati simetri, menyerupai distribusi normal.

Nilai dalam distribusi chi-square tidak pernah negatif (x≥0). Hal ini disebabkan karena distribusi ini didasarkan pada jumlah kuadrat variabel, sehingga hasilnya selalu positif.

Nilai Harapan (Ekspetasi) Distribusi Chi-Square

Nilai harapan atau ekspektasi adalah rata-rata teoretis dari hasil suatu percobaan acak jika percobaan tersebut dilakukan berkali-kali dalam kondisi yang sama. Perlu diperhatikan bahwa distribusi Chi-Square merupakan kasus khusus dari distribusi Gamma.

Pada artikel sebelumnya tentang Distribusi Gamma kita tahu bahwa nilai harapan (ekspetasi) distribusi nya yaitu E(x)=αβ. Dalam hal ini apabila dikaitkan dengan distribusi Chi Square diketahui α = v / 2 dan β=2. Sehingga dapat dijabarkan nilai harapan (ekspetasi) distribusi Chi square yaitu sebagai berikut.

E\left ( x \right )=\frac{v}{2}.2=v

Varians Distribusi Chi-Square

Varians adalah ukuran seberapa jauh hasil-hasil percobaan menyebar dari nilai rata-rata (ekspektasi). Varians menunjukkan tingkat ketidakpastian atau keragaman data. Adapun penjabaran rumus varians dari distribusi Chi- Square adalah sebagai berikut.

\begin{matrix}
Var\left ( x \right )=E\left [ \left ( x-E\left ( x \right ) \right )^{2} \right ] \\
Var\left ( x \right) =E\left [ x^{2}-2x.E\left ( x \right )+\left (E\left ( x \right )  \right )^{2} \right ]\\
Var\left ( x \right )=E\left ( x \right )^{2}-2E\left ( x \right ).E\left ( x \right )+\left (E\left ( x \right )  \right )^{2} \\
Var\left ( x \right )=E\left ( x^{2} \right )-\left (E\left ( x \right )  \right )^{2}\\
\end{matrix} 

dalam hal ini diketahui bahwa untuk nilai E(x) sebesar v . Sedangkan nilai untuk E(x2) yaitu

\begin{matrix}
E\left ( x^{2} \right )=\frac{v}{2}\left ( \frac{v}{2}+1 \right ).2^{2} \\
E\left ( x^{2} \right )=\left ( \frac{v^{2}}{4}+\frac{v}{2} \right ).4\\
E\left ( x^{2} \right )=v^{2}+2v \\
\end{matrix}

Sehingga didapatkan varians untuk distribusi Chi Square yaitu

\begin{matrix}
Var\left ( x \right )=E\left ( x^{2} \right )-\left ( E\left ( x \right ) \right )^{2} \\
Var\left ( x \right )=\left ( v^{2}+2v \right )-v^{2} \\
Var\left ( x \right )=2v\end{matrix}

Keterkaitan Distribusi Chi-Square dengan Distribusi Normal

Distribusi chi-square memiliki hubungan erat dengan distribusi normal. Chi-square berasal dari jumlah kuadrat v variabel acak independen yang berdistribusi normal standar.

Jika Z1​, Z2​, …, Zk​ adalah variabel acak dengan distribusi normal standar N(0,1), maka:

 \chi ^{2}=\sum_{i=1}^{v}Z_{i}^{2}

Persamaan di atas menunjukkan distribusi Chi-Square dengan derajat bebas v . Hubungan ini memungkinkan distribusi chi-square digunakan dalam banyak aplikasi statistik yang melibatkan variabel normal, seperti analisis varians (ANOVA) dan uji goodness of fit.

Kelebihan dan Kelemahan

Distribusi Chi-Square memiliki beberapa kelebihan dan kelemahan diantaranya adalah sebagai berikut.

Kelebihan

  1. Sederhana dan Mudah Digunakan
    Distribusi chi-square memiliki rumus yang sederhana, sehingga mudah digunakan dalam analisis statistik.
  2. Cocok untuk Data Kategorik
    Sangat efektif untuk menguji hubungan atau kesesuaian antara variabel kategoris. Contohnya, analisis tabel kontingensi dalam uji independensi atau uji kesesuaian.
  3. Dapat Menguji Varians Populasi
    Berguna dalam menentukan interval kepercayaan untuk varians atau dalam uji hipotesis terkait varians populasi.
  4. Digunakan dalam Banyak Aplikasi Statistik
    Distribusi ini menjadi dasar untuk banyak metode statistik, seperti analisis regresi, analisis varians, dan model linier umum.
  5. Tersedia dalam Berbagai Software Statistik
    Distribusi chi-square mudah diimplementasikan dengan software seperti SPSS, R, Python, atau Excel, yang mempermudah penggunaannya.

Kelemahan

  1. Sensitif Terhadap Ukuran Sampel Kecil
    Uji chi-square membutuhkan jumlah data yang cukup besar untuk menghasilkan hasil yang valid. Jika ukuran sampel terlalu kecil, hasilnya bisa bias atau tidak akurat.
  2. Asumsi Ekspetasi Minimum (E ≥ 5)
    Dalam tabel kontingensi, distribusi ini mengasumsikan bahwa nilai ekspektasi di setiap sel tabel tidak boleh terlalu kecil (E ≥ 5). Jika tidak terpenuhi, hasilnya kurang dapat dipercaya.
  3. Asumsi Independensi
    Uji chi-square mengasumsikan bahwa data antar kategori bersifat independen. Jika asumsi ini dilanggar, hasil analisis bisa menyesatkan.
  4. Kurva Tidak Simetris
    Karena bentuk kurva distribusi berubah sesuai dengan derajat kebebasan (df), interpretasi pada derajat kebebasan kecil menjadi lebih sulit.
  5. Tidak Cocok untuk Data Kontinu
    Distribusi ini dirancang untuk data kategoris, sehingga kurang tepat jika diterapkan pada data kontinu tanpa transformasi yang sesuai.

Contoh Penggunaan Distribusi Chi-Square

Distribusi Chi-Square memegang peran penting dalam analisis data, dengan penerapan mulai dari pengujian hipotesis hingga validasi model statistik. Penggunaan distribusi ini membantu dalam pengambilan keputusan berbasis data di berbagai bidang, seperti bisnis, kesehatan, pendidikan, dan teknik dan lainnya. Berikut adalah beberapa contoh penggunaan distribusi chi square

A. Penelitian Psikologi dan Sosial
Distribusi Chi-Square sering digunakan dalam penelitian eksperimental untuk menganalisis data hasil survei atau eksperimen yang bersifat kategoris. Sebagai contoh:
Peneliti ingin mengetahui hubungan karakteristik individu dan perilaku sosial, dalam hal ini secara spesifik ingin dilihat apakah jenis kelamin (laki-laki atau perempuan) memengaruhi preferensi untuk menggunakan media sosial tertentu.

chi- square

B. Analisis Keandalan Sistem
Dalam rekayasa dan manufaktur, distribusi Chi Square digunakan untuk mengevaluasi keandalan sistem dan komponen. Dalam hal ini contoh penerapannya diantaranya:
* Keandalan perangkat lunak
Analisis distribusi Chi-Square dapat digunakan untuk menentukan apakah tingkat kegagalan perangkat lunak selama pengujian sesuai dengan harapan.
* Pengujian kualitas produk
Sebuah perusahaan elektronik menguji apakah komponen yang dihasilkan dari beberapa jalur produksi memiliki tingkat cacat yang berbeda.

chi- square

C. Uji Kesesuaian (Goodness of Fit Test)
Distribusi Chi-Square digunakan untuk memeriksa apakah suatu data observasi sesuai dengan distribusi teoretis tertentu.
Contoh penerapan: Pemeriksaan preferensi pelanggan
Sebuah perusahaan ingin mengetahui apakah distribusi pilihan konsumen terhadap berbagai rasa minuman (misalnya coklat, vanila, stroberi) sesuai dengan prediksi awal. Dengan mengumpulkan data preferensi aktual, distribusi Chi-Square dapat digunakan untuk menguji kesesuaian antara data aktual dan data yang diharapkan.

chi- square

Pengembangan Distribusi Chi-Square dalam Pemodelan Statistik

Distribusi chi-square awalnya digunakan untuk menguji kesesuaian distribusi data, distribusi ini kini menjadi fondasi penting dalam berbagai metode dan aplikasi statistik. Berikut adalah beberapa pengembangan distribusi chi-square dalam berbagai pemodelan statistik:

A. Uji Hipotesis untuk Data Kategoris
Distribusi chi-square banyak digunakan dalam uji hipotesis untuk data kategoris, termasuk:

* Uji Kesesuaian (Goodness of Fit Test)
Menguji apakah data yang diamati sesuai dengan distribusi tertentu.

* Uji Independen (Chi Square Test of Independence)
Menguji hubungan antara dua variabel kategoris dalam tabel kontingensi.

* Uji Homogenitas
Memeriksa apakah dua atau lebih populasi memiliki distribusi yang sama.

B. Pemodelan Regresi Logistik dan Analisis Varians
Dalam pemodelan statistik seperti regresi logistik dan analisis varians (ANOVA), distribusi chi-square digunakan untuk:

* Uji Likelihood Ratio
Membandingkan model statistik untuk menentukan model yang lebih baik.

* Uji Parameter
Menguji apakah parameter dalam model signifikan secara statistik.

Sebagai contoh, dalam regresi logistik, distribusi chi-square digunakan untuk mengevaluasi goodness-of-fit atau pengaruh prediktor terhadap variabel respons.

C. Analisis Data Multivariat
Dalam analisis multivariat, distribusi chi-square digunakan untuk:

* Analisis Komponen Utama atau Principal Component Analysis (PCA)
Mengevaluasi kontribusi komponen utama dalam menjelaskan variansi data.

* Uji Multivariat (MANOVA)
Menguji perbedaan rata-rata pada beberapa variabel dependen secara bersamaan.

Chi- square dapat membantu mengukur tingkat kepercayaan dalam hasil analisis dengan memanfaatkan sifat-sifat variabilitas.

Contoh Soal dengan Menerapkan Distribusi Chi-Square

Diketahui sebuah variabel acak x mengikuti distribusi Chi Square dengan derajat bebas (df) yang disimbolkan sebagai v yaitu sebesar 3.

a. Hitung nilai fungsi distribusi probabilitas atau Probability Density Function f(x) untuk x= 2.
b. Berapa peluang bahwa nilai x berada di antara 1 dan 3?

Jawab (soal a):
Untuk penyelesaian soal a dilakukan dengan cara mensubstitusi nilai x=2 dan v=3 pada PDF (Probability Density Function) distribusi chi square, sehingga apabila dijabarkan dapat dituliskan sebagai berikut.

f\left ( 2;3 \right )=\frac{1}{2^{3/2}\Gamma \left ( 3/2 \right )}.2^{1/2}.e^{-2/2}

Persamaan di atas dapat dijabarkan dengan perhitungan sebagai berikut.

\begin{matrix}
f\left ( 2;3 \right )=\frac{1}{2\sqrt{2}.\frac{\sqrt{\Pi }}{2}}.\sqrt{2}.e^{-1} \\
f\left ( 2;3 \right )=\frac{1}{\sqrt{2\Pi }}.\sqrt{2}.\frac{1}{e} \\
f\left ( 2;3 \right )=\frac{1}{\sqrt{\Pi }}.\frac{1}{e} \\
f\left ( 2;3 \right )=\frac{1}{\sqrt{3.1416}}.\frac{1}{2.718}\\
f\left ( 2;3 \right )\approx 0.208
\end{matrix}

Jawab (soal b):
Peluang P(1≤X≤3) adalah hasil integrall dari Probability Density Function untuk distribusi Chi-Square untuk x pada interval [1, 3]. Maka dalam hal ini, bisa kita jabarkan bahwa

\begin{matrix}
P\left ( 1\leq x\leq 3 \right )=\int_{1}^{3}f\left ( x;3 \right )dx \\
P\left (1\leq x\leq 3 \right)=\int_{1}^{3}\frac{1}{2^{3/2}\Gamma \left ( 3/2 \right )}x^{\left ( 3/2 \right )-1}e^{-x/2}dx
\end{matrix}

Untuk menyelesaikan perhitungan integral di atas kita bisa menggunakan bantuan Microsoft Excel , dimana kita perlu menghitung hasil dari P(X≤3) dan P(X≤1).

Untuk menampilkan hasil dari P(X≤3) kita bisa menggunakan rumus excel sebagai berikut dan didapatkan hasil yaitu 0,608

chi-square
Gambar 2. Rumus Excel untuk Menghitung P(X≤3)

Selanjutnya untuk perhitungan P(X≤1) dengan menggunakan rumus excel sebagai berikut dan didapatkan hasil yaitu 0,198. Adapun penjelasan terkait penggunaan fungsi CHISQ.DIST secara detail dapat dibaca pada link berikut.

chi-square
Gambar 3. Rumus Excel untuk Menghitung P(X≤1)
  • P(X≤3) = 0.608
  • P(X≤1) = 0.198 maka didapatkan hasil bahwa
P\left ( 1\leq x\leq 3 \right )=P\left ( x\leq 3 \right )-P\left ( x\leq 1 \right )=0.608-0.198=0.410

Referensi

Walpole, R.E., et al. (2012). Probability & Statistics for Engineers & Scientists, 9th ed. Boston: Pearson Education, Inc.

Agresti, Alan. An Introduction to Categorical Data Analysis. Hoboken, New Jersey: John Wiley & Sons, Inc, 2007.

Nah, sampai juga kita di akhir artikel. Sampai disini dulu penjelasan terkait Distribusi Chi-Square. Jika masih ada yang dibingungkan atau ada yang ingin didiskusikan, bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya. See you!

Sstt...
Mau Kiriman Artikel Terbaru Exsight
Tanpa Biaya Langganan? ????

Nama Kamu

Email Kamu

Dapatkan Akses Informasi Terupdate Seputar Dunia Data dan Statistika 🙂

Exsight ADS

Leave a Comment

Hubungi Admin
Halo, selamat datang di Exsight! 👋

Hari ini kita ada DISKON 20% untuk semua transaksi. Klaim sekarang!