Regresi Non Linear

Analisis Regresi (Part 1): Penjelasan dan Tutorial Regresi Non Linear (Logit, Probit dan Log-Log)

DW ADS

Regresi non linear merupakan suatu metode analisis regresi untuk mendapatkan model non linear yang digunakan untuk mengetahui hubungan antar variabel terikat dan variabel bebas. Apa sih perbedaan dari regresi linear dengan regresi non linear? Jadi, perbedaannya adalah hubungan antara variabel bebas dan variabel terikat pada regresi linear mengikuti garis lurus, sedangkan pada regresi non linear bisa mengikuti pola eksponensial, kuadratik, kubik, logaritmik atau bentuk lainnya selain garis lurus.

Macam-macam Regresi Non Linear

  • Parabola kuadratik:

Dengan menggunakan metode kuadrat terkecil, maka, a,b, dan c dapat dihitung dari sistem persamaan:

  • Parabola kubik :

Untuk menentukan nilai a, b, c, dan d dapat digunakan dengan sistem persamaan berikut:

  • Eksponen

Besar nilai a dan b ditentukan menggunakan persamaan:

  • Geometrik

Besar nilai a dan b ditentukan menggunakan persamaan:

  • Gompertz
  • Logistik

Besar nilai a, b, dan c ditentukan menggunakan persamaan:

  • Hiperbola

Jika Ybar tidak ada yang bernilai nol, maka a dan b adalah

probit

Kali ini kita akan membahas lebih lanju salah satu model yang termasuk dari Regresi Non Linear yaitu Model Regresi Logistik.

Model Regresi Logistik

Model regresi logistik merupakan regresi non linear dimana kurva hubungan antara variabel respon dan variabel prediktornya tidak berbentuk garis lurus. Regresi logistik digunakan untuk menggambarkan hubungan antara variabel respon dengan sekumpulan variabel prediktor, dimana variabel respon bersifat biner atau dikotomus. Variabel dikotomus adalah variabel yang hanya mempunyai dua kemungkinan nilai, misalnya sukses atau gagal. Model regresi logistik mengikuti distribusi bernoulli, dengan fungsi probabilitasnya adalah sebagai berikut  (Haridanti, Adawiyah, & Ariadne, 2018):

Bentuk model regresi logistik adalah sebagai berikut:

Dengan,

Dalam regresi logistik memiliki 3 fungsi hubung yaitu sebagai berikut:

1. Regresi logit

Model regresi logit sering digunakan untuk kasus regresi logistik biner. Hal penting dalam fungsi logit yaitu inversnya harus memenuhi E(Y) antara 0 dan 1. Hal ini akan terpenuhi jika dengan menggunakan distribusi kumulatif atau CDF (Cumulative Distribution Function) sebagai invers fungsi hubung. Model regresi logit yaitu 𝑙𝑜𝑔𝑖𝑡[ 𝑃 𝑌 = 1] = 𝛽0 + 𝛽1𝑥1 + 𝛽2𝑥2 + ⋯ + 𝛽𝑝𝑥𝑝.

2. Regresi probit.

Invers dari CDF distribusi normal baku digunakan sebagai fungsi hubung. jika CDF dari distribusi normal baku dinotasikan dengan Φ (.), maka model dapat dituliskan sebagai 𝜋 = Φ (𝛽0 + 𝛽1𝑥1 + ⋯ + 𝛽𝑝𝑥𝑝). Umumnya probit (𝜋) sering digunakan dalam model sehingga model dapat ditulis sebagai probit(𝜋) = (𝛽0 + 𝛽1𝑥1 + ⋯ + 𝛽𝑝𝑥𝑝). Dengan catatan probit(𝜋) ekuivalen dengan Z_ 𝜋 yaitu kuantil normal baku pada peluang 𝜋.

3. Regresi log-log komplementer .

Invers dari distribusi nilai ekstrim yang digunakan untuk membentuk fungsi hubung. CDF-nya adalah 𝐹 (𝑥) = exp{ – exp [- 𝑥 – 𝜇]/𝜎]} untuk -∞ < 𝑥 < ∞ dan parameter -∞ < 𝜇 < ∞ dan 𝜎 > 0. Model regresi log-log komplementer dapat ditulis dengan 𝜋 = 1 – exp {- exp [𝛽0 + 𝛽1𝑥1 + ⋯ + 𝛽𝑝𝑥𝑝]} atau atau log [- log (1 – 𝜋) = 𝛽0 + 𝛽1𝑥1 + ⋯ + 𝛽𝑝𝑥𝑝 ].

Contoh Regresi Logistik

Gunakanlah data berikut ini dan lakukanlah analisis untuk membangun model yang dapat memprediksi apakah seorang pegawai dapat melaksanakan tugas (1) atau tidak(0) berdasarkan satu variabel bebas yaitu pengalaman yang dimiliki (bulan).

NoMonthTask
1140
2290
360
4251
5181
640
7180
8120
9221
1060
11301
12110
13301
1450
15201
16130
1790
18321
19240
20131
21190
2240
23281
24221
2581

Penyelesaian

  • Memanggil Data di Program R Studio
> sukses<-read.table(file="C:\\Users\\HP 14-BW099TU\\Documents\\data set\\programmingtask.txt", TRUE)
> str(sukses)
'data.frame':	25 obs. of  3 variables:
 $ months: int  14 29 6 25 18 4 18 12 22 6 ...
 $ task  : int  0 0 0 1 1 0 0 0 1 0 ...
 $ fit   : num  0.31 0.835 0.11 0.727 0.462 ...
  • Membuat Model Regresi Probit
> model_probit<-glm(task~months,data=sukses,family=binomial(link='probit'))
> summary(model_probit)

Call:
glm(formula = task ~ months, family = binomial(link = "probit"), 
    data = sukses)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.8959  -0.7579  -0.3907   0.8101   1.9691  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)   
(Intercept) -1.83787    0.69012  -2.663  0.00774 **
months       0.09686    0.03565   2.717  0.00659 **
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 34.296  on 24  degrees of freedom
Residual deviance: 25.380  on 23  degrees of freedom
AIC: 29.38

Number of Fisher Scoring iterations: 4

Persamaan model regresi Probit yaitu

  • Model Regresi Logit
> model_logit<-glm(task~months,data=sukses,family=binomial(link='logit'))
> summary(model_logit)

Call:
glm(formula = task ~ months, family = binomial(link = "logit"), 
    data = sukses)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.8992  -0.7509  -0.4140   0.7992   1.9624  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)  
(Intercept) -3.05970    1.25935  -2.430   0.0151 *
months       0.16149    0.06498   2.485   0.0129 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 34.296  on 24  degrees of freedom
Residual deviance: 25.425  on 23  degrees of freedom
AIC: 29.425

Number of Fisher Scoring iterations: 4

Persamaan model regresi logit:

  • Model Regresi Complementary log-log
> model3<-glm(task~months,data=sukses,family=binomial(link='cloglog'))
> summary(model3)

Call:
glm(formula = task ~ months, family = binomial(link = "cloglog"), 
    data = sukses)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.9294  -0.7545  -0.4850   0.8484   1.8914  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)   
(Intercept) -2.58224    0.95432  -2.706  0.00681 **
months       0.11046    0.04202   2.629  0.00857 **
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 34.296  on 24  degrees of freedom
Residual deviance: 25.677  on 23  degrees of freedom
AIC: 29.677

Persamaan model regresi complementary log-log:

Penutup

Hai gimana guys?? Mudah banget kan cara mengerjakan analisis regresi logistik di R. Kamu tidak perlu repot-repot lagi unuk mencari persamaan analisis regresi dengan menggunakan cara manual. Kamu bisa mengerjakannya dengan R agar lebih cepat selesai karena tinggal tulis kodingnya saja nanti outputnya akan keluar. Eitss jangan lupa masih ada artikel selanjutnya yang akan membahas Part 2, tentang analisis berganda jadi tetap stay tune yaa. Jika masih ada yang kurang jelas, atau masih bingung bisa bertanya di kolom komentar atau menghubungi admin melalui tombol WA yaa. Terima kasih.

Daftar Pustaka

Haridanti, S., Adawiyah, R., & Ariadne, G. S. (2018). Analisis Regresi Non Linear Model Logistik. SENIATI (pp. 62-66). Malang: Institut Teknologi Nasional Malang.

Kismiantini (2020). Analisis Respon Biner. Modul Kuliah. Yogyakarta: Universitas Negeri Yogyakarta.

Kusumawati, R. (2019). Regresi Logistik. Modul Kuliah. Yogyakarta: Universitas Negeri Yogyakarta.

Sstt...
Mau Kiriman Artikel Terbaru Exsight
Tanpa Biaya Langganan? ????

Nama Kamu

Email Kamu

Dapatkan Akses Informasi Terupdate Seputar Dunia Data dan Statistika 🙂

Exsight ADS

Leave a Comment

Hubungi Admin
Halo, selamat datang di Exsight! 👋

Hari ini kita ada DISKON 20% untuk semua transaksi. Klaim sekarang!