Regresi Ridge #1

DW ADS

Hai hai sobat Exsight, dalam metode statistika, tentunya sobat Exsight sudah tidak asing dengan metode regresi. Metode regresi digunakan untuk memahami hubungan antara satu atau lebih variabel independen (prediktor) dan variabel dependen (respon). Seiring berkembangnya ilmu pengetahuan, regresi juga mengalami perkembangan, salah satunya yaitu Regresi Ridge.

Pada artikel ini, akan dibahas lebih mendalam terkait Regresi Ridge, yuk simak dengan seksama yaa!

Definisi

Regresi Ridge merupakan suatu metode statistik yang digunakan dalam regresi linear untuk mengatasi masalah multikolinearitas dan overfitting pada regresi linier. Multikolinearitas terjadi ketika dua atau lebih variabel prediktor saling berkorelasi kuat, sehingga menyebabkan ketidakstabilan dalam perkiraan koefisien regresi dan menyebabkan kesulitan dalam menafsirkan hubungan sebenarnya antara variabel prediktor dan variabel respon.

ridge

Metode regresi Ridge pertama kali diperkenalkan oleh seorang ilmuwan statistik bernama Hoerl dan Kennard pada tahun 1970. Konsep utama dalam regresi Ridge yaitu memasukkan komponen regularisasi ke dalam fungsi objektif regresi linear. Regularisasi ini dikenal sebagai regularisasi L2 atau regularisasi Euclidean, dengan cara menambahkan jumlah kuadrat dari koefisien regresi ke dalam fungsi objektif. Tujuan dari adanya regularisasi yaitu untuk mencegah koefisien regresi yang terlalu besar, mengurangi efek multikolinearitas dan menghasilkan model regresi yang lebih stabil.

Perbandingan Antara Regresi Linier dan Regresi Ridge

Metode regresi linier dan regresi Ridge keduanya digunakan untuk memodelkan hubungan antara variabel prediktor dan variabel respon. Namun terdapat perbedaan mendasar antar kedua metode tersebut, yaitu sebagai berikut.

Regresi Linier

  1. Tujuan Utama
    Regresi linier bertujuan untuk menemukan garis linear terbaik yang meminimalkan error antara data observasi dan garis regresi.
  2. Penanganan Variabel Prediktor
    Regresi linier dapat sensitif terhadap multikolinearitas, yaitu kondisi ketika variabel prediktor saling berkorelasi.
  3. Resiko Overfitting
    Regresi linier rentan terhadap adanya overfitting ketika terdapat banyak variabel prediktor atau ketika data berukuran kecil.
ridge

Regresi Ridge

  1. Tujuan Utama
    Regresi Ridge bertujuan untuk mengatasi masalah multikolinearitas dan overfitting.
  2. Penalti pada Koefisien
    Regresi Ridge menerapkan penalti pada koefisien dengan memasukkan parameter regularisasi L2 (Euclidean) pada fungsi objektif regresi.
  3. Resiko Overfitting
    Regresi Ridge cenderung dapat mengurangi risiko overfitting.

Jadi dapat dikatakan bahwa Regresi Linier digunakan ketika tidak terdapat masalah multikolinearitas yang signifikan dan jumlah variabel prediktor relatif sedikit, sedangkan Regresi Ridge dapat digunakan ketika terdapat masalah multikolinearitas, data berukuran kecil, maupun ketika variabel prediktor cukup banyak, untuk menghindari overfitting.

Formula Matematis

Estimasi parameter model regresi Ridge dapat dijabarkan melalui formula matematis sebagai berikut.

\hat{\beta _{\lambda }}=\left ( X^{T}X+\lambda I \right )^{-1}X^{T}Y

Berdasarkan rumus di atas diketahui bahwa:

\begin{matrix}
\hat{\beta }=Parameter\, estimator\\ 
X=Variabel\, prediktor\\ 
\lambda =Nilai\, tetapan\, bias\\ 
I=Matriks\, identitas\\
Y=Variabel\, Respon

\end{matrix}

Selanjutnya, berdasarkan persamaan rumus di atas dilakukan optimasi model regresi Ridge dengan cara meminimumkan nilai parameter beta, yaitu sebagai berikut.

minimize\left \| Y-X\beta  \right \|_{2}^{2}+\lambda \left \| \beta  \right \|_{2}^{2}\\ 

Berdasarkan persamaan rumus di atas

\left \| \cdot  \right \|

menunjukkan regularisasi L2 (Euclidean) .

Regularisasi dalam Regresi Ridge

Regularisasi L2 (Euclidean) merupakan komponen utama dalam metode regresi Ridge. Regularisasi memiliki peran penting dalam mengatasi masalah multikolinearitas dan mengontrol kompleksitas model dalam regresi Ridge.

Regularisasi L2 (Euclidean) melibatkan penambahan jumlah kuadrat dari koefisien regresi ke dalam fungsi objektif regresi linear. Dalam konteks regresi Ridge, komponen ini dikenal sebagai “penalty L2” atau “norm L2.”

Keuntungan Regresi Ridge

Terdapat beberapa keuntungan dari regresi Ridge, yaitu sebagai berikut.

ridge
  1. Penanganan Multikolinearitas
    Regresi Ridge efektif dalam mengatasi masalah multikolinearitas, yaitu kondisi ketika variabel prediktor saling berkorelasi.
  2. Pencegahan Overfitting
    Regresi Ridge membantu menghindari overfitting dengan cara mengurangi kompleksitas model. Regresi Ridge membatasi ukuran koefisien, metode ini mencegah model terlalu beradaptasi dengan data training dan dapat melakukan prediksi yang lebih baik pada data testing.
  3. Stabilisasi Koefisien
    Koefisien yang dihasilkan dari estimasi pada regresi Ridge lebih stabil dan konsisten dikarenakan adanya Regularisasi L2 (Euclidian).
  4. Performa pada Dataset Kecil
    Regresi Ridge memiliki performa yang baik pada dataset dengan ukuran kecil sehingga tepat digunakan ketika data terbatas.
  5. Menghindari Solusi Tidak Stabil
    Dalam beberapa kasus, regresi linier biasa dapat menghasilkan solusi yang tidak stabil atau memiliki varian yang tinggi. Regresi Ridge mengatasi masalah ini dengan menambahkan regularisasi L2 (Euclidian).
  6. Fleksibilitas Aplikasi
    Regresi Ridge dapat diterapkan di berbagai bidang, seperti ilmu sosial, ilmu alam, ekonomi, dan teknik.

Referensi

Hastie, T. (2020). Ridge Regularization: An Essential Concept in Data Science. Technometrics: Volume 62.

Soemartini. (2008). Penyelesaian Multikolinearitas Melalui Metode Ridge Regression. Pustaka Ilmiah, Jurusan Statistika, Universitas Padjadjaran.

Hoerl, A., & Kennard, R. (1970). Ridge Regression: Applications to Nonorthogonal Problems. Technometrics, Vol.12, No.1, doi: 10.1080/00401706.1970.10488635.

Sampai disini dulu penjelasan terkait Regresi Ridge. Jika masih ada yang dibingungkan bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya.

Sstt...
Mau Kiriman Artikel Terbaru Exsight
Tanpa Biaya Langganan? ????

Nama Kamu

Email Kamu

Dapatkan Akses Informasi Terupdate Seputar Dunia Data dan Statistika 🙂

Exsight ADS

Leave a Comment

Hubungi Admin
Halo, selamat datang di Exsight! 👋

Hari ini kita ada DISKON 20% untuk semua transaksi. Klaim sekarang!