Salah satu analisis data yang paling sering digunakan dalam keilmuan statistik yaitu regresi, dimana jenis regresi yang digunakan umumnya berupa regresi parametrik. Namun sayangnya pada kondisi tertentu jenis regresi parametrik tidak dapat digunakan karena adanya asumsi tertentu yang terlalu membatasi dan tidak memadai untuk menggambarkan hubungan yang kompleks di antara data.
Maka dari itu diperlukan jenis regresi yang tidak terlalu membutuhkan banyak asumsi tertentu yaitu regresi Nonparametrik. Pembahasan tentang nonparametrik, sebelumnya pernah dibahas pada artikel Exsight yaitu Mengenal Statistika Nonparametrik dengan Mudah .
Nah dalam artikel ini, kita akan lebih fokus untuk membahas terkait regresi Nonparametrik, yuk yuk simak artikel ini dengan seksama yaa!
Definisi
Regresi nonparametrik merupakan suatu pendekatan dalam metode regresi yang digunakan untuk mengetahuhi pola hubungan antara variabel respon dan prediktor, dimana fungsi dari kurva regresi tidak diketahui serta tidak bergantung pada asumsi statistik tertentu.
Melalui pendekatan dalam regresi nonparametrik, hubungan antar variabel dapat digambarkan secara fleksibel. Fungsi hubungan dalam regresi nonparametrik dapat berbentuk kurva yang melengkung, linier, atau polinomial, sesuai dengan pola yang teramati dalam data itu sendiri tanpa dibatasi oleh model-parametrik yang telah ada sebelumnya.
Tujuan
Tujuan dari adanya regresi nonparametrik yaitu mendapatkan perkiraan yang akurat tentang hubungan antara variabel yang tidak dapat dijelaskan dengan baik oleh model-parametrik, tanpa harus terikat asumsi matematis tertentu.
Selain itu regresi ini dapat mengurangi bias yang mungkin muncul pada model parametrik serta dapat menghasilkan prediksi yang lebih akurat, terutama ketika hubungan antara variabel bersifat kompleks atau tidak terstruktur.
Kelebihan dan Kelemahan
Kelebihan
Beberapa kelebihan dari Regresi Nonparametrik diantaranya:
- Fleksibel dalam menggambarkan hubungan antara variabel
- Tidak memerlukan asumsi tertentu sehingga lebih unggul dalam menghadapi data yang tidak memenuhi asumsi parametrik, tanpa mengurangi risiko bias yang disebabkan oleh asumsi yang salah.
- Dapat menangkap hubungan nonlinear antara variabel secara lebih baik daripada regresi parametrik, sehingga lebih akurat saat terdapat pola hubungan yang melengkung, berkelok-kelok, atau tidak linier.
Kelemahan
Adapun kelemahan dari Regresi Nonparametrik diantaranya:
- Cenderung membutuhkan jumlah data yang lebih besar dibandingkan regresi parametrik untuk mendapatkan estimasi yang akurat.
- Memerlukan waktu komputasi yang lebih lama daripada regresi parametrik, khususnya ketika data yang digunakan sangat besar atau kompleks.
- Rentan terhadap risiko overfitting. Overfitting terjadi ketika model terlalu rumit, sehingga kinerjanya menurun saat dihadapkan pada data baru.
- Interpretasi hasil pada regresi nonparametrik sering kali lebih rumit dibandingkan dengan regresi parametrik, khususnya interpretasi terkait pengujian hipotesis dan interval kepercayaan.
Jenis-Jenis Regresi Nonparametrik
Terdapat beberapa jenis regresi nonparametrik yaitu:
1.Regresi Spline Truncated
Regresi spline truncated menggunakan fungsi spline untuk menggambarkan hubungan antara variabel respon dan prediktor. Fungsi spline terdiri dari segmen-segmen polinomial yang menghubungkan titik data. Regresi spline dapat menjadi linier atau nonlinier, tergantung pada jumlah dan letak titik simpul spline.
2.Regresi Lokal atau Regresi LOESS (Locally Weighted Scatterplot Smoothing)
Regresi LOESS menggunakan pendekatan yang berbeda untuk setiap titik data. Regresi ini memberikan bobot yang lebih tinggi pada titik-titik data yang lebih dekat dengan titik yang akan diprediksi, sehingga memberikan perkiraan yang lebih akurat untuk bagian-bagian kritis dalam rentang data.
3. Regresi Kernel
Regresi kernel menggunakan fungsi kernel untuk memperoleh perkiraan hubungan antara variabel. Fungsi kernel memberikan bobot pada titik-titik data berdasarkan jarak dari titik yang akan diprediksi. Dalam regresi kernel, titik data yang berdekatan memiliki bobot yang lebih tinggi, sehingga memberikan kontribusi yang lebih besar dalam perkiraan.
4. Regresi Nonparametrik Berbasis Jarak (Distance-Based Nonparametric Regression)
Regresi ini digunakan untuk menggambarkan hubungan antara variabel dengan mempertimbangkan jarak antara titik-titik data. Contoh dari regresi nonparametrik berbasis jarak diantaranya yaitu metode regresi regresi K-nearest neighbors (KNN) dan regresi Nadaraya-Watson. Pada regresi ini titik yang akan diprediksi didasarkan pada nilai-nilai tetangga terdekat dalam variabel.
5. Regresi Rank
Regresi rank adalah metode regresi yang berfokus pada peringkat variabel prediktor. Regresi ini digunakan ketika hubungan antara variabel tidak dapat dijelaskan melalui fungsi matematis yang sederhana. Regresi rank memprediksi peringkat variabel respon berdasarkan peringkat variabel prediktor, tanpa memperhatikan nilai pastinya.
6.Regresi Tree-Based
Regresi Tree-Based menggunakan pendekatan pohon keputusan atau pohon regresi untuk memodelkan hubungan antara variabel. Pohon regresi membagi data menjadi segmen-segmen berdasarkan nilai-nilai variabel prediktor serta berdasarkan rata-rata atau median pada variabel respon dalam setiap segmen pohon.
7. Regresi Gauss Campuran (Mixture-of-Gaussians)
Regresi Mixture-of-Gaussians mengasumsikan bahwa data dihasilkan dari campuran beberapa distribusi Gauss dan memodelkan hubungan antara variabel dengan memperhatikan distribusi-distribusi tersebut.
Setiap jenis regresi nonparametrik memiliki keunikan dan kegunaannya sendiri dalam mengatasi masalah dan karakteristik data yang berbeda. Pemilihan metode regresi nonparametrik yang sesuai tergantung pada konteks analisis dan tujuan.
Referensi
Sekian penjelasan terkait Regresi Nonparametrik. Jika masih terdapat hal-hal yang dibingungkan bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya.