Analisis regresi merupakan suatu model matematis yang dapat digunakan untuk mengetahui pola hubungan antara dua atau lebih variabel. Salah satu cara untuk menganalisis hubungan antara variabel dependen yang mempunyai kategori lebih dari dua, dengan beberapa variabel independen yang bersifat kontinu, kategorik atau keduanya adalah dengan menggunakan analisis regresi logistik multinomial.
Distribusi Multinomial
Distribusi multinomial adalah generalisasi dari distribusi binomial dengan kriteria banyaknya kategori lebih dari dua (biner).
Definisi: Misal setiap percobaan bisa menghasilkan c kategori yang berbeda E1, E2, …, Ec masing-masing dengan probabilitas π1, π2, …, πc, maka distribusi multinomial f(n1, n2, …, nc; π1, π2, …, πc ;n ) akan memberikan probabilitas bahwa E1 akan muncul sebanyak 𝑛1 kali, E2 akan muncul sebanyak 𝑛2 kali, … dan Ecakan muncul sebanyak 𝑛𝑐 kali. Sehingga dalam pengambilan sampel independen sebanyak n kali terdapat
Contoh: Sebuah bandar udara memiliki 3 buah landasan pacu (runway). Probabilitas sebuah runway dipilih oleh pesawat yang akan mendarat adalah: Runway 1 = 2/9 ; Runway 2 = 1/6; dan Runway 3 = 11/18. Berapakah probabilitas 6 pesawat yang datang secara acak jika didistribusikan ke dalam runway-runway sebagai berikut :
Runway 1 = 2 pesawat; Runway 2 = 1 pesawat; Runway 3 = 3 pesawat?
Penyelesaian:
Dengan asumsi pemilihan runway acak dan independen, disebutkan bahwa 𝜋1 = 2/9 , 𝜋2= 1/6 , dan 𝜋3 = 11/18 . Maka probabilitas untuk 𝑛1 = 2, 𝑛2= 1, dan 𝑛3 = 3 adalah :
𝑓(𝑛1 = 2, 𝑛2 = 1, 𝑛3 = 3; 𝜋1 =2/9, 𝜋2 = 1/6, 𝜋3 = 11/18 ; n = 6)
yaitu:
Regresi Logistik Multinomial
Regresi logistik multinomial adalah regresi logistik yang digunakan jika variabel dependen mempunyai skala yang bersifat polikotomus (polychotomous) atau multinomial. Skala multinomial adalah suatu pengukuran yang dikategorikan menjadi lebih dari dua kategori. Regresi logistik multinomial merupakan perluasan regresi logistik biner, dengan kata lain apabila variabel dependen bersifat multinomial maka analisis hubungan kausal yang digunakan adalah regresi logistik multinomial. Bentuk persamaan regresi logistik multinomial ke j kategori adalah sebagai berikut:
Mengetahui pengaruh dari variabel independen dilakukan uji signifikansi secara simultan dan secara parsial sebagai berikut:
Uji Simultan
Uji simultan dilakukan untuk mengetahui apakah terdapat variabel independen yang berpengaruh signifikan terhadap variabel dependen.
Hipotesis
H0 : tidak terdapat satupun variabel independen yang berpengaruh secara signifikan terhadap variabel dependen
H1 : minimal terdapat salah satu variabel independen yang berpengaruh secara signifikan terhadap variabel dependen Statistik Uji G atau likelihood ratio test:
Keterangan:
n0 adalah banyaknya observasi yang berkategori 0
n1 adalah banyaknya observasi yang berkategori 1
n3 adalah banyaknya observasi yang berkategori 2
Statistik uji G berdistribusi Chi-Square dengan derajat bebas
dengan Cb adalah banyaknya kategori variabel independen ke-b, b = 1, 2, …, m. Sedangkan j adalah banyaknya kategori variabel dependen.
Kriteria Uji : Tolak H0 jika G ≥ χ2(α,v) dengan α adalah tingkat signifikansi yang dipilih.
Uji Parsial
Uji parsial digunakan untuk menguji signifikansi masing-masing parameter βjk.
Hipotesis:
H0 : tidak terdapat variabel independen yang berpengaruh secara signifikan terhadap variabel dependen
H1 : terdapat variabel independen yang berpengaruh secara signifikan terhadap variabel dependen
Statistik uji menggunakan uji wald sebagai berikut:
Daerah penolakan: Tolak H0 jika |W| > Zα/2 atau W2 > χ2(v,α); derajat bebas v.
Setelah dilakukan uji simultan dan uji parsial selanjutnya akan dilakukan uji kesesuaian model untuk mengetahui kesesuaian model antara variabel dependen dan variabel independen.
Uji Kesesuaian Model
Statistik uji yang digunakan adalah uji pearson chi-square sebagai berikut:
Hipotesis
H0 : model sesuai (tidak ada perbedaan yang nyata antara hasil observasi dengan kemungkinan hasil prediksi model)
H1 : model tidak sesuai (ada perbedaan yang nyata antara hasil observasi dengan kemungkinan hasil prediksi model).
Statistik uji chi-square:
Keterangan:
j = 0, 1, 2, …, c
Daerah penolakan : Tolak H0 jika χ2 ≥ χ2(db, α) dengan db = j-(p+1).
Interpretasi Model Regresi Logistik Multinomial
Tabel odds ratio 2 x 2 pada variabel respon dichotomous merupakan konsep yang dikembangkan untuk polychotomous. Pada variabel respon dichotomous respon terbagi menjadi dua kategori, sedangkan pada trychotomous variabel respon terbagi dalam tiga kategori dan akan mempunyai outcome yang bernilai 0,1,2. Maka untuk menjelaskan odds ratio pada variabel trychotomous dengan variabel prediktor 2 kategori depat digunakan tabel 2×3 sebagai berikut:
Tabel Nilai Model Regresi Logistik Multinomial (Trichotomous)
Dengan perlakuan yang sama seperti pada model dichotomus, didapatkan odds ratio sebagai berikut:
Nilai odds ratio 𝜓 (OR) diguanakan untuk menunjukkan kecenderungan hubungan suatu variabel X terhadap variabel Y.
Penutup
Nah, sekian penjelasan terkait teori regresi logistik multinomial. Kamu bisa membaca artikel mengenai jenis regresi logistik lainnya pada “REGRESI LOGISTIK : MODEL REGRESI LOGISTIK BINER” ataupun artikel jenis regresi lainnya di web https://exsight.id/blog/
Jika masih penasaran atau kurang jelas terkait regresi logistik multinomial bisa bertanya di kolom komentar atau menghubungi admin melalui tombol bantuan di kanan bawah.
See you di artikel selanjutnya!
Referensi
http://himasta.unimus.ac.id/wp-content/uploads/2022/01/Regresi-Logistik-Multinomial.pdf
Novianti, S. R. (n.d.). ANALISIS REGRESI LOGISTIK MULTINOMIAL PADA PEMILIHAN ALAT KONTRASEPSI WANITA. Buletin Ilmiah Math. Stat. dan Terapannya (Bimaster), VIII(4), 751-758.