Memahami Regresi Kuantil: Konsep, Metode, dan Aplikasi

DW ADS

Hai hai sobat Exsight, dalam dunia statistik dan analisis data, metode regresi merupakan salah satu metode yang paling umum digunakan untuk memahami hubungan antara variabel-variabel dalam sebuah dataset. Namun, jika kita ingin melihat lebih dalam dari sekadar nilai rata-rata dan memperhatikan variasi pada berbagai level dari distribusi data, maka regresi kuantil menjadi pilihan yang lebih tepat. Regresi kuantil, atau yang juga dikenal sebagai quantile regression, adalah teknik yang memungkinkan kita untuk memodelkan hubungan antara variabel prediktor dan variabel respons pada berbagai persentil dari distribusi data.

Pada artikel ini kita akan membahas lebih dalam terkait regresi kuantil, yuk simak artikel ini dengan seksama yaa!

Definisi

Regresi Kuantil merupakan metode statistik yang digunakan untuk memodelkan hubungan antara variabel prediktor dan variabel respons pada berbagai persentil dari distribusi data. Berbeda dengan regresi linier biasa yang fokus pada memprediksi nilai rata-rata dari variabel respons, regresi kuantil lebih fokus pada variasi pada berbagai persentil dari distribusi tersebut.

Tujuan utama regresi kuantil adalah untuk memperkirakan parameter regresi untuk setiap persentil yang diinginkan dari distribusi data. Dengan demikian, regresi kuantil memungkinkan kita untuk memahami bagaimana hubungan antara variabel prediktor dan variabel respons yang bervariasi di berbagai tingkat dari distribusi data.

Regresi Kuantil merupakan suatu pendekatan dalam analisis regresi yang dikenalkan oleh Koenker dan Bassett pada tahun 1978. Pendekatan regresi kuantil digunakan untuk menduga berbagai fungsi kuantil dari suatu distribusi Y sebagai fungsi dari X. Regresi Kuantil sangat berguna jika distribusi data tidak homogen (heterogen) dan tidak berbentuk standar.

Konsep Dasar

Kuantil

Dalam konteks regresi kuantil, “kuantil” merujuk pada nilai-nilai yang membagi distribusi data menjadi beberapa bagian yang sama besar. Secara lebih spesifik, kuantil adalah titik-titik pada distribusi data yang membagi data menjadi bagian-bagian yang memiliki proporsi yang sama dari total jumlah data.

Dalam regresi kuantil, kita dapat menentukan kuantil yang digunakan dengan beberapa cara:

  1. Kuantil Spesifik
    Kita dapat secara langsung menentukan kuantil yang ingin kita teliti. Misalnya, kita tertarik pada kuantil ke-0,1, ke-0,25 (kuartil pertama), ke-0,5 (median), ke-0,75 (kuartil ketiga), dan sebagainya.
  2. Interval Kuantil
    Kadang-kadang, kita tertarik untuk memeriksa hubungan antara variabel prediktor dan variabel respons pada sejumlah kuantil yang terletak dalam interval tertentu. Misalnya, kita ingin melihat hubungan pada kuantil antara ke-0,2 dan ke-0,8.
  3. Kuantil Seragam
    Dalam beberapa kasus, kita mungkin ingin memeriksa hubungan pada kuantil yang tersebar secara merata. Misalnya, kita ingin memeriksa hubungan pada kuantil setiap 0,1 atau setiap 0,05 dari distribusi data.
  4. Kuantil yang Diberikan oleh Konteks Penelitian
    Kadang-kadang, penelitian atau konteks tertentu menentukan kuantil yang paling relevan untuk diperiksa. Misalnya, dalam studi kesehatan, kita mungkin tertarik pada kuantil yang memisahkan populasi menjadi kelompok risiko tinggi dan rendah.

Memilih kuantil yang sesuai untuk dianalisis merupakan bagian penting dari proses regresi kuantil. Pemilihan kuantil yang tepat harus mempertimbangkan tujuan penelitian, sifat distribusi data, serta interpretasi hasil yang diharapkan.

Bentuk persamaan umum dari model regresi kuantil adalah sebagai berikut.

Y_{i}=\beta _{0,\tau }+\beta _{1,\tau X_{1,i}}+...+\beta _{k,\tau X_{k,i}}+\varepsilon _{i,\tau }\, \, i=1,...,n

dimana

\begin{matrix}
Y_{i}=Nilai\, pengamatan\, ke-i\\ 
\beta _{0,\tau }=Koefisien\, konstanta\, atau\, intersep\, pada\, kuantil\, ke-\tau \\ 
\beta _{k,\tau }=Koefisien\, variabel\, bebas\, ke-k\, pada\, kuantil\, ke-\tau\\ 
X_{k,i}=Nilai\,pengamatan\,ke-i\, pada\, variabel\, bebas\, ke-k \\ 
\varepsilon _{i,\tau }=Nilai\, galat/sisaan\, pengamatan\, ke-i\, pada\, kuantil\, ke-\tau 
\end{matrix}

atau dalam notasi matriks untuk kuantil ke-𝜏 dapat ditulis sebagai berikut

Y=X\beta _{\tau }+\varepsilon _{\tau }\,\, \, \,  dimana
Y=\left [ \begin{matrix}
y_{1}\\ 
y_{2}\\ 
\vdots \\ 
y_{n}
\end{matrix} \right ],X=\begin{bmatrix}
1 &  X_{11}&  X_{21}&  \cdots & X_{k1}\\ 
1 &  X_{12}&  X_{22}&  \cdots & X_{k2}\\ 
\cdots   &\cdots   &\cdots   &\ddots   &\vdots  \\ 
1 &  X_{1n}&  X_{2n}&  \cdots &X_{kn} 
\end{bmatrix}\, \, ,\beta =\begin{bmatrix}
\beta _{0\tau }\\ 
\beta _{1\tau }\\ 
\vdots \\ 
\beta _{k\tau }
\end{bmatrix}\, \, ,\varepsilon =\begin{bmatrix}
\varepsilon _{1\tau }\\ 
\varepsilon _{2\tau }\\ 
\vdots \\ 
\varepsilon _{\pi \tau }
\end{bmatrix}

Perbedaan Antara Regresi Kuantil dengan Regresi Linier

Terdapat perbedaan mendasar, jika dilakukan perbandingan antara Regresi Kuantil dan Regresi Linier.

Regresi KuantilRegresi Linier
TujuanMemodelkan hubungan antara variabel prediktor dan variabel respons pada berbagai persentil dari distribusi data, bukan hanya pada nilai rata-rata.Memprediksi nilai rata-rata dari variabel respons berdasarkan variabel prediktor.
Pendekatan EstimasiMenggunakan metode yang mengestimasi parameter pada berbagai persentil dari distribusi data, seperti metode Least Absolute Deviations (LAD) atau Quantile Regression (QR).Menggunakan metode Ordinary Least Squares (OLS) untuk menemukan garis regresi terbaik yang meminimalkan jumlah kuadrat selisih antara nilai observasi dan nilai prediksi.
Sensitivitas terhadap Outlier (Data Pencilan)Lebih robust terhadap keberadaan outlier dalam dataset karena memperhitungkan berbagai persentil dari distribusi data.Rentan terhadap pengaruh outlier karena berfokus pada estimasi nilai rata-rata, sehingga satu atau beberapa pencilan dapat memengaruhi hasil secara signifikan.
Distribusi DataTidak mengasumsikan distribusi Normal pada data dan dapat digunakan untuk data yang tidak terdistribusi Normal.Mengasumsikan distribusi normal pada data dan hasilnya optimal ketika asumsi ini terpenuhi.
Interpretasi HasilMemberikan pemahaman yang lebih lengkap tentang bagaimana hubungan antara variabel prediktor dan variabel respons berubah di berbagai bagian dari distribusi data.Fokus pada interpretasi koefisien regresi, yang menggambarkan hubungan linier antara variabel prediktor dan variabel respons pada nilai rata-rata.

Metode Estimasi Regresi Kuantil

Metode estimasi yang umum digunakan dalam regresi kuantil adalah Least Absolute Deviations (LAD) dan Quantile Regression (QR). Dengan menggunakan regresi kuantil, kita dapat memperoleh pemahaman yang lebih lengkap tentang bagaimana faktor-faktor prediktor memengaruhi nilai ekstrim atas dan bawah dari variabel respons, bukan hanya nilai rata-rata.

A. Metode Least Absolute Deviations (LAD)

  • Metode Least Absolute Deviations menggunakan pendekatan untuk meminimalkan jumlah absolut dari selisih antara variabel respons yang diamati dan variabel respons yang diprediksi oleh model regresi kuantil.
  • Pendekatan ini lebih tahan terhadap pencilan dalam data karena tidak memberikan bobot yang berlebihan pada nilai-nilai ekstrim.
  • Dalam implementasinya, metode Least Absolute Deviations sering menggunakan optimasi numerik untuk menemukan estimasi parameter regresi yang optimal.

B. Metode Quantile Regression (QR)

  • Metode Quantile Regression (QR), atau Regresi Kuantil, juga memperkirakan parameter regresi untuk berbagai persentil dari distribusi data.
  • Berbeda dengan metode Least Absolute Deviations (LAD), metode Quantile Regression (QR) memodelkan persentil secara eksplisit menggunakan fungsi kerugian kuantil.
  • Metode Quantile Regression (QR) sering menggunakan algoritma optimasi khusus seperti gradient descent untuk menemukan estimasi parameter regresi yang optimal untuk setiap persentil.

Metode Least Absolute Deviations (LAD) dan metode Quantile Regression (QR) digunakan untuk memperkirakan parameter regresi pada berbagai persentil dari distribusi data. Perbedaan dari kedua metode tersebut yaitu terletak pada pendekatan matematis yang digunakan dalam proses estimasi. Metode LAD meminimalkan jumlah absolut dari selisih antara data yang diamati dan yang diprediksi, sementara metode QR menggunakan fungsi kerugian kuantil.

Dalam praktiknya, metode Least Absolute Deviations (LAD) dan metode Quantile Regression (QR) dapat memberikan hasil yang serupa tergantung pada struktur data dan kompleksitas model. Namun, dalam metode Quantile Regression (QR) sering kali lebih fleksibel dan dapat menangani situasi yang lebih kompleks karena memungkinkan pemodelan secara langsung dari persentil yang diinginkan.

Kelebihan dan Kelemahan

Beberapa kelebihan dan kelemahan dalam regresi kuantil diantaranya:

Kelebihan

  1. Fleksibilitas
    Regresi kuantil memungkinkan analisis yang lebih fleksibel karena tidak hanya memperhatikan nilai rata-rata, tetapi juga memperhatikan variasi pada berbagai persentil dari distribusi data.
  2. Robust terhadap Pencilan
    Regresi kuantil cenderung lebih robust terhadap adanya pencilan (outlier) dalam dataset, karena memperhitungkan kondisi pada berbagai persentil sehingga tidak terlalu dipengaruhi oleh nilai ekstrim.
  3. Mempertimbangkan Distribusi Non-Normal
    Metode regresi kuantil tidak mengasumsikan distribusi normal pada data, sehingga cocok digunakan untuk data yang tidak terdistribusi secara normal.
  4. Informasi Lebih Lengkap
    Dengan memodelkan berbagai persentil dari variabel respons, regresi kuantil memberikan informasi yang lebih lengkap tentang hubungan antara variabel prediktor dan respons, termasuk dalam situasi di mana ada heteroskedastisitas atau ketidakseimbangan dalam data.

Kelemahan

  1. Komputasi yang Intensif
    Estimasi regresi kuantil dapat membutuhkan komputasi yang lebih intensif dibandingkan dengan regresi linier biasa, terutama ketika ingin memperoleh estimasi untuk beberapa persentil.
  2. Interpretasi yang Kompleks
    Hasil dari regresi kuantil seringkali sulit untuk diinterpretasikan secara langsung, terutama bagi peneliti yang tidak memiliki latar belakang statistik yang kuat.
  3. Sensitif terhadap Pemilihan Persentil
    Hasil dari regresi kuantil bisa berbeda-beda tergantung pada persentil yang dipilih, sehingga pemilihan persentil yang tepat menjadi krusial.
  4. Keterbatasan pada Variabel Prediktor
    Regresi kuantil dapat mengalami kesulitan dalam menangani model dengan banyak variabel prediktor, terutama dalam situasi di mana ada korelasi antar variabel prediktor. Hal ini dapat menyebabkan overfitting atau masalah multicollinearity.

Penerapan dalam Berbagai Bidang

Regresi kuantil, memiliki kemampuan untuk memodelkan hubungan antara variabel prediktor dan variabel respons pada berbagai persentil dari distribusi data, selain itu regresi kuantil memiliki beragam penerapan dalam berbagai bidang. Berikut beberapa contoh penerapan regresi kuantil dalam bidang yang berbeda:

  1. Ekonomi dan Keuangan
    • Dalam analisis ekonomi dan keuangan, regresi kuantil digunakan untuk memahami bagaimana faktor-faktor ekonomi mempengaruhi berbagai aspek dari distribusi pendapatan atau kekayaan. Hal ini membantu dalam merancang kebijakan ekonomi yang lebih inklusif dan merata.
    • Contoh penerapannya adalah dalam memodelkan distribusi pendapatan rumah tangga, di mana regresi kuantil memungkinkan untuk memahami bagaimana faktor-faktor seperti pendidikan, usia, atau pekerjaan memengaruhi pendapatan pada berbagai level persentil.
kuantil

2. Kesehatan

  • Dalam penelitian medis dan kesehatan, regresi kuantil dapat digunakan untuk memahami hubungan antara faktor risiko dan kesehatan pada level yang berbeda dari distribusi. Hal ini dapat membantu kita dalam identifikasi kelompok risiko tinggi dan perancangan intervensi yang lebih efektif.
  • Contoh penerapannya adalah dalam memodelkan hubungan antara indeks massa tubuh (BMI) dan risiko penyakit jantung pada berbagai level persentil BMI.
kuantil

3. Lingkungan

  • Dalam studi lingkungan, regresi kuantil dapat digunakan untuk memahami bagaimana faktor-faktor seperti polusi udara, suhu, atau kepadatan populasi mempengaruhi berbagai aspek lingkungan pada level yang berbeda.
  • Contoh penerapannya adalah dalam memodelkan distribusi suhu udara di suatu kota dan mengidentifikasi zona-zona yang rentan terhadap gelombang panas pada level persentil yang berbeda.
kuantil

4. Sosial dan Demografi

  • Dalam penelitian sosial dan demografi, regresi kuantil dapat membantu memahami distribusi dan faktor-faktor yang memengaruhi berbagai indikator sosial dan demografi seperti pendidikan, penghasilan, atau migrasi.
  • Contoh penerapannya adalah dalam memodelkan hubungan antara tingkat pendidikan orang tua dan kinerja akademik anak-anak pada berbagai level persentil.
kuantil

Referensi

Pramesti, E., Setiawan, & Prastyo, D. (2022). Analisis Perangkingan Perguruan Tinggi Negeri Berbadan Hukum (PTN-BH) di Indonesia Berdasarkan Indikator Publikasi Penelitian pada Lembaga Internasional. Jurnal Sains dan Seni ITS, Vol.11, No.3.

Hananingrum, A., & Achmad, A. (2021). Regresi Kuantil pada Data Jumlah Kematian Bayi di Jawa Timur pada Tahun 2019. Prosiding Statistika SPeSIA (Seminar Penelitian Sivitas Akademika Unisba), Vol.7, No.1.

Goh, S. C. dan Knight, K. (2009). Nonstandard Quantile-Regression Inference. Econometric Theory. Vol. 25, hal. 1415-1432

Finally, sampai sudah kita di penghujung artikel, sekian penjelasan terkait Regresi KuantilApabila masih ada yang dibingungkan bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya.

Sstt...
Mau Kiriman Artikel Terbaru Exsight
Tanpa Biaya Langganan? ????

Nama Kamu

Email Kamu

Dapatkan Akses Informasi Terupdate Seputar Dunia Data dan Statistika 🙂

Exsight ADS

Leave a Comment

Hubungi Admin
Halo, selamat datang di Exsight! 👋

Hari ini kita ada DISKON 20% untuk semua transaksi. Klaim sekarang!