Alifia Hana Linda Rachmawati

Analisis Multivariat – Partial Least Square (PLS)

Halo sobat Exsight! Sebagian besar pembaca mungkin lebih sering mendengar istilah Structural Equation Modelling (SEM) dibanding dengan Partial Least Square (PLS). PLS adalah jenis analisis statistik yang kegunaanya mirip dengan SEM. Penasaran? Yuk kepoin dalam salah satu metode statistika yang bernama PLS!

Pendekatan Partial Least Square pertama kali dikembangkan oleh Herman Wold, seorang guru yang mengembangan SEM. Partial Least Square merupakan metode alternatif dari Structural Equation Modelling (SEM), yang menggunakan pendekatan variance based atau component based. Ghozali (2014:10) menjelaskan bahwa PLS adalah metode analisis yang bersifat soft modeling karena tidak mendasarkan pada asumsi data harus dengan skala pengukuran, distribusi data (distribution free) dan jumlah sample tertentu, yang berarti jumlah sample diperbolehkan kecil (di bawah 100 sample). Menurut Wolf dalam Ghozali (2014) pendekatan PLS lebih cocok untuk tujuan prediksi, oleh karena itu pendekatan untuk mengestimasi variable laten dianggap sebagai kombinasi linier dari indikator sehingga menghindarkan masalah indeterminacy dan memberikan definisi yang pasti dari komponen skor.

PLS dibandingkan dengan SEM dapat menangani dua masalah serius, yaitu:

  1. Solusi yang tidak dapat diterima (inadmissible solution). Hal ini terjadi karena PLS berbasis varians dan buka covarian, sehingga masalah matriks singularity tidak akan pernah terjadi. Di samping itu, PLS bekerja pada model structural yang bersifat rekursif, sehingga masalah un-identified, under-identified atau over-identified juga tidak akan terjadi.
  2. Faktor yang tidak dapat ditentukan (factor indeterminacy), yaitu adanya lebih dari satu factor yang terdapat dalam sekumpulan indicator sebuah variable. Khusus indicator yang bersifat formatif tidak memerlukan adanya common factor sehingga selalu akan diperoleh variable laten yang bersifat komposit. Dalam hal ini variable laten merupakan kombinasi linier dari indikator-indikatornya.

PLS memiliki beberapa kelebihan seperti, algoritma PLS tidak terbatas hanya untuk hubungan antara indikator dengan variable latennya yang bersifat refleksif namun juga bisa dipakai untuk hubungan formatif. Kelebihan lain yan dimiliki yakni PLS dapat digunakan untuk ukuran sampel yang relative kecil, PLS dapat digunakan untuk model yang sangat kompleks, dan dapat digunakan Ketika distribusi skew (Yamin dan Kurniawan, 2011). Namun, metode PLS juga memiliki kekurangan yaitu distribusi data tidak diketahui sehingga tidak bisa menilai signifikansi statistik. Kelemahan pada metode PLS ini dapat diatasi menggunakan metode resampling atau bootstrap. PLS dapat diolah dengan menggunakan software seperti SmartPLS, Warp PLS, Tetrad, PLS-PM, dan sebagainya.

VARIABEL DALAM PLS

Variabel Konstruk/Laten

  • Konstruk adalah suatu ukuran yang abstrak, tidak dapat diamati langsung (unobservable).
  • Di dalam model jalur, konstruk direpresentasikan dengan gambar lingkaran (o) atau oval (ᴑ)
  • Jenis konstruk atau variabel laten:

a. Variabel eksogen (exogeneous variable) : sama dengan variabel independen / variabel bebas, yakni variabel yang bersifat mempengaruhi variabel lain, disimbolkan dengan ξ (dibaca ksi) dan dan ditandai dengan variabel dimana anak panah berawal

Dalam gambar 1 variabel eksogen dicontohkan dengan variabel A.

 b. Variabel endogen (endogeneous variable) : sama dengan variabel dependen / variabel terikat, yakni variabel yang dipengaruhi, disimbolkan dengan η (dibaca eta) dan ditandai dengan variabel dimana anak panah berakhir

Dalam gambar 1, variabel endogen dicontohkan dengan variabel B dan C. Namun demikian, variabel endogen juga dapat berperan ganda, yakni berperan sebagai variabel bebas sekaligus juga variabel terikat, misalnya pada variabel perantara/intervening, seperti B. Untuk kasus seperti ini, maka B tetap dikatakan variabel endogen.

Partial Least Square

Indikator/Manifest/Observed

  • Umumnya disebut sebagai item atau variabel manifest, yakni variabel yang dapat teramati/terukur (observed variables).
  • Direpresentasikan dalam model jalur dengan gambar persegi panjang. Dalam gambar 1 dicontohkan dengan A1, A2, A3, B1, B2 dan C1.

ANALISIS PEMODELAN DENGAN PENDEKATAN PLS

Konseptualisasi Model

Konseptualisasi model adalah langkah awal dalam analisis PLS, dimana peneliti harus melakukan pengembangan dan pengukuran konstruk. Dalam tahap ini terdapat dua model yang akan dirancang, yaitu :

a. Merancang Model Struktural (Inner Model)

Model structural atau inner model merupakan model yang menggambarkan hubungan antar konstruk (variable laten). Hubungan antar konstruk didasarkan kepada teori atau asumsi-asumsi tertentu.

b. Merancang Model Pengukuran atau Measurement Model (Outer Model)

Model Pengukuran adalah model yang mendeskripsikan hubungan antar variable laten (konstruk) dengan indikatornya. Model-model pengukuran di dalam PLS ada dua, yaitu:

  • Model reflektif: mengasumsikan bahwa konstruk atau variable laten mempengaruhi indikator. Arah panah berawal dari variable laten menuju kepada indikator.
  • Model formatif: mengasumsikan bahwa semua indikator ke konstruk dan indikator sebagai grup secara Bersama-sama menentukan konsep atau makna empiris dari konstruk. Arah panah berawal dari indicator menuju ke variable laten.

Mengkonstruksikan Diagram Jalur (Path Diagram)

Path diagram dikonstruksi dengan menggunakan path models yang menjelaskan pola hubungan antara variabel laten dengan indikator-indikatornya, sehingga dengan memvisualisasikan hubungan antara indikator dengan konstruknya serta hubungan antara konstruk, maka akan lebih mempermudah peneliti untuk melihat model secara komprehensif.

Model Spesifikasi dengan PLS

Model analisis jalur semua variable laten dalam PLS terdiri tiga set hubungan, yaitu inner model yang spesifikasi hubungan antara variable laten (structural model), outer model yang merupakan spesifikasi hubungan antara variable laten dengan indicator atau variable manifestnya (measurement model), dan weight relation yang mana nilai kasus dari variable laten dapat diestimasi.

a. Inner Model

Inner model (inner relation structural model dan substantive theory) menggambarkan hubungan antar variabel laten berdasarkan pada substantive theory. Dari model structural akan diperoleh besarnya pengaruh variable eksogen terhadap variable endogen baik langsung maupun tidak langsung. Model struktural dengan partial least square di desain untuk model recursive yaitu model yang menggambarkan hubungan kausal antara variabel laten eksogen dengan variabel laten endogen, atau disebut sebagai “hubungan sistem kausal berantai” (causal chain system), yang secara spesifik model persamaannya dapat ditulis sebagai berikut :

Keterangan :

η = matriks variable laten endogen

β = koefisien matriks variable endogen

ξ = matriks konstruk laten eksogen

Г = koefisien matriks variable eksogen

ζ = inner model residual matriks

b. Outer Model

Outer model sering juga disebut (outer relation atau measurement model) mendefinisikan bagaiaman setiap blok indikator berhubungan dengan variabel latennya. Blok dengan indicator refleksi dapat ditulis persamaan sebagai berikut:

Dengan x dan y adalah indikator atau variabel manifest untuk variabel laten eksogen ξ dan variabel laten endogen η, sedangkan \Lambda _{x} dan \Lambda _{y} adalah matriks loading yang menggambarkan koefisien regresi sederhana yang menghubungkan variabel laten dengan indikatornya. Residual yang diukur dengan εx dan εy dapat diinterpretasikan sebagai kesalahan tingkat pengukuran atau noise.

Blok dengan indicator formatif dapat ditulis dengan persamaan sebagai berikut:

Dengan ξ sebagai variabel laten eksogen, η sebagai variabel laten endogen, x sebagai indikator pada variabel laten eksogen, y sebagai indikator untuk variabel laten endogen, πξ dan πη sebagai koefisien regresi berganda dari variabel laten dan blok indikator, serta dan sebagai residual regresi.

c. Weight Relation

Spesifikasi model pada outer model dan inner model dilakukan dalam tingkat konseptual, tidak secara nyata mengetahui nilai suatu variable laten. Oleh karena itu, diperlukan weight relation untuk nilai kasus variable yang diestimasi dalam PLS. Estimasi skor variable laten dapat dituliskan sebagai berikut:

Dengan ki adalah banyaknya variabel indikator untuk setiap variabel laten, Wbk dan Wjk adalah k weight yang digunakan untuk membentuk variabel laten  ξb dan ηj . Penggunan relasi bobot dalam PLS dapat menghindari masalah ketidakpastian (factor indeterminacy) yang hadir dalam model structural berbasis kovarian

Estimasi Parameter PLS

Metode pendugaan parameter (estimasi) di dalam PLS adalah metode kuadrat terkecil (least square methods). Proses perhitungan dilakukan dengan cara iterasi, dimana iterasi akan berhenti jika telah tercapai kondisi konvergen.

Pendugaan parameter di dalam PLS meliputi 3 hal, yaitu :

  1. Weight estimate digunakan untuk menciptakan skor variabel laten
  2. Estimasi jalur (path estimate) yang menghubungkan antar variabel laten dan estimasi loading antara variabel laten dengan indikatornya.
  3. Means dan lokasi parameter (nilai konstanta regresi, intersep) untuk indikator dan variabel laten.

Estimasi dilakukan dengan algoritma PLS yang berlangsung dalam tiga tahap. Langkah pertama dalam estimasi PLS terdiri dari prosedur iterasi regresi sederhana atau regresi berganda dengan memperhitungkan hubungan model struktural/inner model, model pengukuran/outer model dan estimasi bobot/weight relation. Kemudian hasil dari estimasi satu set bobot digunakan untuk menghitung nilai skor variabel laten, yang mana merupakan kombinasi linier dari variabel indikator / manifest. Setelah estimasi skor variabel laten diperoleh, maka Langkah kedua dan ketiga melibatkan estimasi koefisien model struktural (inner model) dan koefisien dari masing-masing model pengukuran (outer model). Pada dasarnya algoritma PLS merupakan serangkaian regresi sederhana dan berganda dengan estimasi ordinary least square.

Evaluasi Model PLS

  1. Evaluasi Model Struktural (inner model)

Model structural dievaluasi dengan menggunakan R-square untuk konstruk dependen, Stone-Geisser Q-square test untuk predictive relevance, dan uji t serta signifikansi dari koefisien parameter jalur structural. Perubahan nilai R2 dapat digunakan untuk menilai pengaruh variabel laten independen tertentu terhadap variabel laten dependen apakah mempunyai pengaruh yang substantif (Ghozali, 2014:42). Nilai R2 dapat dihitung dengan persamaan berikut:

Model PLS juga di evaluasi dengan melihat Q-square prediktif relevansi oleh model dan juga etimasi parameternya. Nilai Q-square > 0 menunjukkan model memilki predictive relevance, sebaliknya jika nilai Q-square ≤ 0 menunjukkan model kurang memiliki predictive relevance. Nilai Q-square dapat dihitung dengan rumus:

Besaran Q2 memiliki nilai dengan entang 0 < Q2 < 1, dimana semakin mendekati 1 berarti semakin baik. Besaran Q2 ini setara dengan koefisien determinasi total pada analisis jalur (path analysis).

2. Evaluasi Model Pengukuran (outer model)

Pengujian dengan PLS dimulai dengan pengujian model pengukuran untuk menguji validitas konstruk dan reliabilitas instrumen. Uji validitas dilakukan untuk mengukur kemampuan instrumen penelitian apa yang seharusnya diukur. Uji validitas konstruk dalam PLS dilaksanakan melalui uji convergent validity, discriminant validity dan average extracted (AVE). Uji reliabilitas digunakan untuk mengukur konsistensi alat ukur dalam mengukur konsep atau dapat juga digunakan untuk mengukur konsistensi responden dalam menjawab instrumen. Instrumen dikatakan andal jika jawaban seseorang terhadap pernyataan adalah konsisten atau stabil dari waktu ke waktu. Uji reliabilitas dalam PLS dapat menggunakan metode composite reliability dan cronbach’s alpha.

Convergent validity dari model pengukuran dengan model reflektif indikator dinilai berdasarkan korelasi antara item score/component score dengan construct score yang dihitung dengan PLS. Ukuran reflektif dikatakan tinggi jika berkorelasi lebih dari 0,70 dengan konstruk yang ingin diukur. Namun demikian untuk penelitian tahap awal dari pengembangan skala pengukuran nilai loading 0,5 sampai 0,6 dianggap cukup.

Discriminant validity adalah membandingkan nilai square root of average variance extracted (AVE) setiap konstruk dengan korelasi antara konstruk lainnya dalam model. Jika nilai akar AVE setiap konstruk lebih besar daripada nilai korelasi antar konstruk dengan konstruk lainnya dalam model, maka dikatakan memiliki nilai descriminant validity yang baik. Pengukuran ini dapat digunakan untuk mengukur reliabilitas component score variabel laten dan hasilnya lebih konservatif dibandingkan dengan ukuran composite reliability. Direkomendasikan nilai AVE harus lebih besar 0,50. AVE dapat dihitung dengan rumus sebagai berikut:

Composite reliability merupakan Kelompok Indikator yang mengukur sebuah variabel memiliki reliabilitas komposit yang baik jika memiliki composite reliability ≥ 0.7, walaupun bukan merupakan standar absolut. Dapat dihitung dengan rumus :

3. Pengujian Hipotesis

Pengujian hipotesis (β, γ, dan λ) dilakukan dengan metode resampling Bootstrap yang dikembangkan oleh Geisser & Stone.a.

a. Hipotesis statistic untuk outer model

H0 : λi = 0

H0 : λi ≠ 0

b. Hipotesis statistic untuk inner model: variable eksogen terhadap endogen

H0 : γi = 0

H0 : γi ≠ 0

c. Hipotesis statistic untuk inner model: variable endogen terhadap endogen

H0 : βi = 0

H0 : βi ≠ 0

d. Statistik uji: t-test; p-value ≤ 0,05 (alpha 5%); signifikan

e. Outer model signifikan: indikator bersifat valid

f. Inner model signifikan: terdapat pengaruh signifikan

g. PLS tidak mengasumsikan data berdistribusi normal: menggunakan teknik resampling dengan metode bootstrap, dengan sampel minimum 30.

Sekian penjelasan terkait PLS. Jika masih ada yang dibingungkan bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya.

REFERENSI

Ghozali, Imam., 2014, Structural Equation Modeling, Metode Alternatif dengan Partial Least Square (PLS), Edisi 4, Semarang: Badan Penerbit Universitas Diponegoro.

Yamin, S. dan Kurniawan, H. 2011. Partial Least Square Path Modelling. Buku Seri Keempat. Jakarta: Salemba Infotek.

Anuraga, G., Sulistiyawan, E., & Munadhiroh, S. (2017). Structural Equation Modeling – Partial Least Square untuk Pemodelan Indeks Pembangunan Kesehatan Masyarakat (IPKM) di Jawa Timur. Seminar Nasional Matematika dan Aplikasinya, 257- 263.

Jaya, I. N., & Sumertajaya, I. (2008). Pemodelan Persamaan Struktural dengan Partial Least Square. Semnas Matematika dan Pendidikan Matematika , 118 – 132. Rodliyah, M. (2016). Estimasi Score Factor dengan Partial Least Square (PLS) pada Measuremen Model. 17 – 28

Analisis Multivariat – Partial Least Square (PLS) Read More »

REGRESI LOGISTIK : MODEL REGRESI LOGISTIK MULTINOMIAL

Analisis regresi merupakan suatu model matematis yang dapat digunakan untuk mengetahui pola hubungan antara dua atau lebih variabel. Salah satu cara untuk menganalisis hubungan antara variabel dependen yang mempunyai kategori lebih dari dua, dengan beberapa variabel independen yang bersifat kontinu, kategorik atau keduanya adalah dengan menggunakan analisis regresi logistik multinomial.

Distribusi Multinomial

Distribusi multinomial adalah generalisasi dari distribusi binomial dengan kriteria banyaknya kategori lebih dari dua (biner).

Definisi: Misal setiap percobaan bisa menghasilkan c kategori yang berbeda E1, E2, …, Ec masing-masing dengan probabilitas π1,  π2, …, πc, maka distribusi multinomial f(n1, n2, …, nc;  π1,  π2, …, πc ;n ) akan memberikan probabilitas bahwa E1 akan muncul sebanyak 𝑛1 kali, E2 akan muncul sebanyak 𝑛2 kali, … dan Ecakan muncul sebanyak 𝑛𝑐 kali. Sehingga dalam pengambilan sampel independen sebanyak n kali terdapat

Contoh: Sebuah bandar udara memiliki 3 buah landasan pacu (runway). Probabilitas sebuah runway dipilih oleh pesawat yang akan mendarat adalah: Runway 1 = 2/9 ;  Runway 2 = 1/6;  dan Runway 3 = 11/18. Berapakah probabilitas 6 pesawat yang datang secara acak jika didistribusikan ke dalam runway-runway sebagai berikut :

Runway 1 = 2 pesawat; Runway 2 = 1 pesawat; Runway 3 = 3 pesawat?

Penyelesaian:

Dengan asumsi pemilihan runway acak dan independen, disebutkan bahwa 𝜋1 = 2/9 , 𝜋2= 1/6 , dan 𝜋3 = 11/18 .  Maka probabilitas untuk 𝑛1 = 2, 𝑛2= 1, dan 𝑛3 = 3 adalah :

𝑓(𝑛1 = 2, 𝑛2 = 1, 𝑛3 = 3; 𝜋1 =2/9, 𝜋2 = 1/6, 𝜋3 = 11/18 ; n = 6)

yaitu:

Regresi Logistik Multinomial

Regresi logistik multinomial adalah regresi logistik yang digunakan jika variabel dependen mempunyai skala yang bersifat polikotomus (polychotomous) atau multinomial. Skala multinomial adalah suatu pengukuran yang dikategorikan menjadi lebih dari dua kategori. Regresi logistik multinomial merupakan perluasan regresi logistik biner, dengan kata lain apabila variabel dependen bersifat multinomial maka analisis hubungan kausal yang digunakan adalah regresi logistik multinomial. Bentuk persamaan regresi logistik multinomial ke j kategori adalah sebagai berikut:

Mengetahui pengaruh dari variabel independen dilakukan uji signifikansi secara simultan dan secara parsial sebagai berikut:

Uji Simultan

Uji simultan dilakukan untuk mengetahui apakah terdapat variabel independen yang berpengaruh signifikan terhadap variabel dependen.

Hipotesis

H0 : tidak terdapat satupun variabel independen yang berpengaruh secara signifikan terhadap variabel dependen

H1 : minimal terdapat salah satu variabel independen yang berpengaruh secara signifikan terhadap variabel dependen Statistik Uji G atau likelihood ratio test:

Keterangan:

n0 adalah banyaknya observasi yang berkategori 0

n1 adalah banyaknya observasi yang berkategori 1

n3 adalah banyaknya observasi yang berkategori 2

Statistik uji G berdistribusi Chi-Square dengan derajat bebas

dengan Cb adalah banyaknya kategori variabel independen ke-b, b = 1, 2, …, m. Sedangkan j adalah banyaknya kategori variabel dependen.

Kriteria Uji : Tolak H0 jika G ≥ χ2(α,v)  dengan α adalah tingkat signifikansi yang dipilih.

Uji Parsial

Uji parsial digunakan untuk menguji signifikansi masing-masing parameter βjk.

Hipotesis:

H0 : tidak terdapat variabel independen yang berpengaruh secara signifikan terhadap variabel dependen

H1 : terdapat variabel independen yang berpengaruh secara signifikan terhadap variabel dependen

Statistik uji menggunakan uji wald sebagai berikut:

Daerah penolakan: Tolak H0 jika |W| > Zα/2  atau W2 > χ2(v,α); derajat bebas v.

Setelah dilakukan uji simultan dan uji parsial selanjutnya akan dilakukan uji kesesuaian model untuk mengetahui kesesuaian model antara variabel dependen dan variabel independen.

Uji Kesesuaian Model

Statistik uji yang digunakan adalah uji pearson chi-square sebagai berikut:

Hipotesis

H0 : model sesuai (tidak ada perbedaan yang nyata antara hasil observasi dengan kemungkinan hasil prediksi model)

H1 : model tidak sesuai (ada perbedaan yang nyata antara hasil observasi dengan kemungkinan hasil prediksi model).

Statistik uji chi-square:

Keterangan:

j = 0, 1, 2, …, c

Daerah penolakan : Tolak H0  jika χ2  ≥ χ2(db, α) dengan db = j-(p+1).

Interpretasi Model Regresi Logistik Multinomial

Tabel odds ratio 2 x 2 pada variabel respon dichotomous merupakan konsep yang dikembangkan untuk polychotomous. Pada variabel respon dichotomous respon terbagi menjadi dua kategori, sedangkan pada trychotomous variabel respon terbagi dalam tiga kategori dan akan mempunyai outcome yang bernilai 0,1,2. Maka untuk menjelaskan odds ratio pada variabel trychotomous dengan variabel prediktor 2 kategori depat digunakan tabel 2×3 sebagai berikut:

Tabel Nilai Model Regresi Logistik Multinomial (Trichotomous)

Tabel Nilai Model Regresi Logistik Multinomial

Dengan perlakuan yang sama seperti pada model dichotomus, didapatkan odds ratio sebagai berikut:

Nilai odds ratio 𝜓 (OR) diguanakan untuk menunjukkan kecenderungan hubungan suatu variabel X terhadap variabel Y.

Penutup

Nah, sekian penjelasan terkait teori regresi logistik multinomial. Kamu bisa membaca artikel mengenai jenis regresi logistik lainnya pada “REGRESI LOGISTIK : MODEL REGRESI LOGISTIK BINER” ataupun artikel jenis regresi lainnya di web https://exsight.id/blog/

Jika masih penasaran atau kurang jelas terkait regresi logistik multinomial bisa bertanya di kolom komentar atau menghubungi admin melalui tombol bantuan di kanan bawah.

See you di artikel selanjutnya!

Referensi

http://himasta.unimus.ac.id/wp-content/uploads/2022/01/Regresi-Logistik-Multinomial.pdf

Novianti, S. R. (n.d.). ANALISIS REGRESI LOGISTIK MULTINOMIAL PADA PEMILIHAN ALAT KONTRASEPSI WANITA. Buletin Ilmiah Math. Stat. dan Terapannya (Bimaster), VIII(4), 751-758.

REGRESI LOGISTIK : MODEL REGRESI LOGISTIK MULTINOMIAL Read More »

Tutorial Regresi Logistik Biner di SPSS

Halo, sobat Exsight! Masih ingat dengan artikel Exsight yang membahas tentang Teori dari Model Regresi Logistik Biner? Jika kamu belum membacanya, kamu bisa klik link ini ya.

Nah pada artikel ini, Exsight membahas tentang Tutorial Pengolahan Regresi Logistik Biner dengan SPSS. Contoh kasus yang digunakan yaitu sebuah penelitian yang berjudul Determinan Melek Keuangan Mahasiswa di Universitas Tugu Muda. Di mana variabel bebas ada 3 yaitu Jenis Kelamin, Fakultas dan Indeks Prestasi Mahasiswa. Jenis Kelamin terdiri dari 2 kategori yaitu “laki-laki (kode 1)” dan “perempuan (kode 0)”. Fakultas terdiri dari 2 kategori yaitu “Non Ekonomi (kode 0)” dan “Ekonomi (kode1)”. Indeks Prestasi Kumulatif (IPK) terdiri dari 2 kategori yaitu “IPK < 2,5 (kode 0)” dan “IPK ≥ 2,5 (kode 1)”. Sebagai catatan: kategori yang Tinggi diberi kode 1 dan kategori Rendah diberi kode 0. Data yang digunakan pada contoh kasus penelitian dapat di klik pada link ini.

Persamaan Regresi Logistik Biner dalam penelitian ini, sebagai berikut:

Dimana:

P          : Peluang mahasiswa memiliki literasi keuangan yang lebih tinggi

1-P      : Peluang mahasiswa memilii literasi keuangan yang lebih rendah

β0 : Konstanta

β1  : Koefisien regresi Jenis Kelamin

JK   : Jenis Kelamin

β2 : Koefisien regresi Fakultas

FAK     : Fakultas

 β3 : Koefisien regresi IPK

IPK      : Indeks Prestasi Kumulatif              

ε : error

Tahapan Pengolahan Regresi Logistik Biner

Contoh kasus sebuah penelitian yang berjudul Determinan Melek Keuangan Mahasiswa di Universitas Tugu Muda menggunakan SPSS.

1. Input Data

a. Masukan data dari file link ini ke SPSS (Data View). Klik Variabel View dan ubah seperti pada tampilan di bawah ini

b. Masukan data Jenis Kelamin (JK), Fakultas (FAK), Indeks Prestasi Kumulatif (IPK), dan Kategori ke SPSS. Klik Variabel View –  klik values pada JK sebagai berikut:

Klik values pada FAK sebagai berikut:

Klik values pada IPK sebagai berikut:

Klik values pada Kategori sebagai berikut:

2. Selanjutnya pada menu klik Analyze – Regression – Binary Logistic
3. Kemudian masukan Variabel Terikat (Kategori) ke Dependent dan masukkan semua Variabel Bebas (JK, FAK, IPK) ke Covariates
4. Pilih Save lalu centang Probabilities, Group membership, Unstandardized dan Studentized, kemudian klik Continue.
5. Selanjutnya pilih Options lalu centang Classification plots, Hosmer-lemeshow goodness-of-fit, Casewise listing residuals dan pilih Outliers outside dan isi dengan angka 2, Correlation of estimate, Iteration history, CI for exp(B) dan isi dengan 95

Sedangkan nilai Maximum iteration nilai 20 dan nilai Classification Cutoff tetap 0,5. Nilai ini disebut dengan the cut value atau prior probability, yaitu peluang suatu observasi untuk masuk ke dalam salah satu kelompok sebelum karakteristik variabel penjelasanya diketahui. Apabila kita tidak mempunyai informasi tambahan tentang data, maka bisa langsung menggunakan nilai default yaitu 0,5. Jika tidak ada penelitian sebelumnya, dapat digunakan classification cutoff sebesar 0,5. Namun, jika ada penelitian lain yang meneliti maka bisa dinaikkan/diturunkan classification cutoff sesuai hasil penelitian.

6. Pada jendela utama, klik OK. Selanjutnya dapat dilihat pada output

Output dan Interpretasi

Model Regresi Logistik Biner:

Uji Multikolinearitas

Dari hasil uji dengan SPSS didapat korelasi JK terhadap FAK, IPK terhadap FAK begitu sebaliknya didapatkan nilai sebesar 0,037 pada korelasi JK terhadap FAK maupun sebaliknya, dan sebesar 0,127 pada korelasi IPK terhadap FAK maupun sebaliknya dimana kurang dari 0,8. Karena kurang dari 0,8 maka tidak terjadi multikolinieritas.

Uji Goodness of Fit

Hipotesis:

H0        : Model sesuai (tidak ada perbedaan antara observasi dan prediksi)

H1        : Model tidak sesuai (ada perbedaan antara observasi dan prediksi)

Taraf signifikansi : α = 0,05

Statistik Uji :

Kriteria Uji  : Tolak H0 jika Sig. < α = 0,05 atau C >c2=15,507

Karena nilai Sig. = 0,645 >α (0,05) dan C =  < c2 , maka H0 diterima yang berarti bahwa model sesuai atau tidak ada perbedaan antara observasi dan prediksi.

Berdasarkan uji-uji tersebut, maka diperoleh model sebagai berikut :

Dimana:

Menilai Model Fit dan Keseluruhan Model (Overall Model Fit)

Hipotesis:
H0 : tidak ada variabel X yang signifikan mempengaruhi variabel Y
H1 : minimal ada satu variabel X yang mempengaruhi variabel Y

Taraf Signifikansi: α = 0,05

Kriteria Uji : Tolak H0 jika nilai sig < α (0,05)
Dari omnibus test di atas terlihat bahwa sig = 0,011

Keputusan : Tolak H0 karena nilai sig = 0,011 < α = 0,05

Kesimpulan: Terlihat bahwa nilai G2 sebesar 11,106 dengan p-value 0,011 (Model) yang berarti dengan tingkat keyakinan 5%, minimal ada satu variabel X yang signifikan mempengaruhi variabel Y. Sehingga dapat disimpulkan bahwa model dapat digunakan untuk analisis lebih lanjut.

Koefisien Determinasi

Dari tabel di atas, dapat dilihat bahwa model dengan memasukkan tiga variabel independen ternyata telah terjadi perubahan dalam penaksiran parameter (-2 Log likelihood) sebesar 54,235. Jika dilihat nilai R-square sebesar 0,199 atau 19,9% (Cox & Snell) dan 0,273 atau 27,3% (Nagelkerke R Square). Dengan demikian dapat ditafsirkan bahwa dengan tiga variabel yaitu FAK, JK dan IPK maka proporsi pemahaman terhadap literasi keuangan sangat tinggi yang dijelaskna sebesar 27,3%. Tetapi perlu diingat bahwa interpretasi ini hanya nilai pendekatan saja seperti dalam koefisien determinasi (regresi linier biasa)

Matriks Klasifikasi

Uji Hipotesis

Uji Rasio Likelihood (Uji Keseluruhan)

Hipotesis:

H0     : β1= β2= β3= 0

H1     : minimal ada satu βjk≠ 0 ; j = 1, 2,3

Taraf signifikansi: α = 0,05

Statistik Uji :

Kriteria Uji  : Tolak H0 jika

Karena = 54,235 > = 7,815, maka H0 ditolak, yaitu secara bersama-sama variabel bebas mempengaruhi model atau model signifikan.

Uji Wald

Hipotesis:

H0        : βk = 0

H1        : βk ≠ 0, k = 1, 2, 3

Taraf signifikansi : α = 0,05

Statistik Uji :

Kriteria Uji      :         

Tolak H0 jika Sig. < α = 0,05

VariabelEstimasiSEWaldSig.Keputusan
JK0,0810,6820,0143,8410,905H0 diterima
FAK2,0820,6948,9973,8410,003H0 ditolak
IPK0,5570,6840,6633,8410,415H0 diterima

Kesimpulan: Pada taraf signifikansi α = 0,05 untuk JK, IPK H0 diterima, maka nilai koefisien regresi sama dengan 0 (nol) sehingga kedua variabel ini tidak berpengaruh terhadap Y. Dan untuk FAK H0 ditolak, maka nilai koefisien regresi tidak sama dengan 0 (nol) sehingga variabel FAK berpengaruh terhadap Y.

Penutup

Nah, sekian penjelasan terkait Tutorial Pengolahan Regresi Logistik Biner dengan SPSS. Jika masih penasaran terkait regresi logistik biner atau regresi logistik lainnya, jangan sungkan untuk bertanya di kolom komentar atau menghubungi admin melalui tombol bantuan di kanan bawah. Jangan lupa untuk membaca artikel Exsight lainnya di web https://exsight.id/blog/

Referensi

https://ekonometrikblog.files.wordpress.com/2017/02/regresi-logistik-biner.pdf

Tutorial Regresi Logistik Biner di SPSS Read More »

Hubungi Admin
Halo, selamat datang di Exsight! 👋

Hari ini kita ada DISKON 20% untuk semua transaksi. Klaim sekarang!