Evaluasi Model dalam Statistik #1

DW ADS

Sobat Exsight tentunya sudah tau dong, jika ilmu statistik berkaitan erat dengan hal analisis data dan pengambilan keputusan. Namun apakah sobat sudah tau, bagaimana cara untuk memastikan bahwa model statistik yang kita gunakan telah memberikan hasil yang akurat dan terpecaya?

Yaps yaitu dengan melakukan evaluasi model.

Pada artikel ini akan dibahas secara rinci terkait evaluasi model yang meliputi definisi, tujuan, metrik evaluasi, serta teknik validasi model yang sering digunakan oleh para peneliti. Yuk simak artikel ini dengan seksama yaa!

Definisi

Evaluasi model merupakan suatu proses untuk mengukur dan memeriksa kinerja suatu model statistik dengan data yang ada, sehingga memungkinkan kita untuk mengidentifikasi kekuatan dan kelemahan model statistik yang terbentuk.

Evaluasi model berpera penting dalam berbagai sub bidang di statistik, diantaranya seperti data mining, machine learning, dan kecerdasan buatan. Evaluasi model memainkan peran kunci dalam menghasilkan model yang dapat diandalkan dan berguna dalam membuat keputusan dan prediksi yang akurat.

Tujuan

Beberapa tujuan utama dari adanya evaluasi model yaitu sebagai berikut.

  1. Mengukur seberapa akurat model dalam memprediksi atau mengklasifikasikan data yang belum pernah dilihat sebelumnya.
  2. Membandingkan berbagai model statistik yang berbeda, untuk melihat model mana yang memberikan kinerja terbaik yang paling sesuai dengan tujuan analisis kita.
  3. Mengidentifikasi kelemahan dan kekuatan model statistik yang digunakan.
  4. Memvalidasi hasil analisis statistik yang diperoleh, sehingga kita dapat memastikan bahwa hasil yang diberikan oleh model dapat dipercaya dan dapat digunakan untuk membuat keputusan yang cerdas.
  5. Membantu dalam memastikan bahwa model statistik yang digunakan dapat diterapkan secara luas dan tidak hanya sesuai dengan data pelatihan (data training) yang digunakan. Dengan menguji model pada data yang tidak digunakan dalam data training, kita dapat mengukur sejauh mana model dapat menggeneralisasi pola yang ada dalam data yang belum pernah dilihat sebelumnya.

Metrik Evaluasi Model

Metrik merupakan alat yang digunakan untuk untuk mengukur kualitas dan kinerja model.
Dalam hal ini metrik evaluasi sangat erat kaitannya dengan Confusion matrix . Confusion matrix adalah sebuah tabel yang digunakan untuk mengevaluasi kinerja model klasifikasi. Tabel ini memberikan gambaran tentang sejauh mana model dapat mengklasifikasikan data dengan benar atau salah dalam masing-masing kategori.

evaluasi model
Gambar 1. Confusion Matrix

Confusion matrix terdiri atas 4 bagian, yaitu true positive (TP), true negative (TN), false positive (FP), dan false negative (FN).

  • True Positive (TP) menggambarkan jumlah observasi yang diklasifikasikan dengan benar sebagai positif oleh model.
  • True Negative (TN) menggambarkan jumlah observasi yang diklasifikasikan dengan benar sebagai negatif oleh model.
  • False Positive (FP) menggambarkan jumlah observasi yang salah diklasifikasikan sebagai positif oleh model.
  • False Negative (FN) menggambarkan jumlah observasi yang salah diklasifikasikan sebagai negatif oleh model.

Selanjutnya berdasarkan Confusion Matrix, dapat dijabarkan beberapa metrik yang digunakan dalam evaluasi model yaitu sebagai berikut.

1.Akurasi
Akurasi digunakan untuk mengukur sejauh mana model statistik dapat mengklasifikasikan data dengan benar. Rumus perhitungan akurasi berdasarkan elemen-elemen pada confusion matrix adalah sebagai berikut.

evaluasi model

2. Presisi
Presisi digunakan dalam mengukur sejauh mana hasil positif yang diklasifikasikan oleh model benar. Rumus perhitungan presisi yaitu

evaluasi model

3. Recall (Sensitifitas)
Recall atau biasa juga disebut sensitifitas digunakan untuk mengukur sejauh mana model dapat mengklasifikasikan secara benar semua data positif yang sebenarnya.

evaluasi model

4. Spesifisitas
Spesifisitas digunakan untuk mengukur sejauh mana model dapat mengklasifikasikan secara benar semua data negatif yang sebenarnya.

evaluasi model

5. F1-Score
F1-Score digunakan untuk menghitung nilai rata-rata harmonis dari metrik presisi dan recall. Rumus perhitungan F1-Score yaitu

evaluasi model

Selain metrik evaluasi yang telah dipaparkan sebelumnya, terdapat pula metrik lainnya seperti AUC, ROC, Precision-Recall Curve, Mean Absolute Error (MAE), Mean Squared Error (MSE), R-Squared, dan lain-lain. Pemilihan metrik evaluasi yang tepat tergantung pada konteks dan tujuan spesifik dari analisis data yang dilakukan.

Teknik Validasi Model

Dalam evaluasi model, terdapat beberapa teknik validasi yang umum digunakan untuk menguji dan memvalidasi kinerja model.

A. Holdout
Holdout merupakan teknik pemisahan dataset menjadi 2 bagian terpisah: data pelatihan (data training) dan data pengujian (data testing). Namun, perlu diingat bahwa validasi holdout bisa rentan terhadap variasi dan memiliki keterbatasan jika dataset terbatas.

Model dilatih menggunakan data training dan kemudian model diuji dengan menggunakan data testing. Proporsi pembagian data training dan data testing yang seringkali digunakan diantaranya:

  • Training (90%), Testing (10%)
  • Training (80%), Testing (20%)
  • Training (70%), Testing (30%)
  • Training (60%), Testing (40%)

B. Validasi Silang (Cross-Validation)
Validasi silang adalah teknik yang umum digunakan untuk menguji kinerja model pada dataset yang terbatas. Dalam validasi silang, dataset dibagi menjadi beberapa subset atau lipatan (folds), di mana model dilatih dan diuji secara berulang dengan memvariasikan subset yang digunakan sebagai data training dan data testing. Hasil dari pengujian ini kemudian diambil rata-rata untuk memberikan estimasi kinerja model secara keseluruhan.

C. Validasi Bootstrap
Validasi Bootstrap merupakan teknik validasi yang melibatkan sampel ulang dengan penggantian dari dataset yang ada. Dalam validasi bootstrap, sejumlah sampel diambil secara acak dari dataset, dengan penggantian, dan model dilatih dan diuji pada sampel tersebut. Proses ini diulang beberapa kali untuk menghasilkan estimasi yang lebih stabil tentang kinerja model.

Kesimpulan

1.Secara keseluruhan, evaluasi model merupakan komponen penting dalam proses analisis data yang dapat membantu kita dalam memilih, memperbaiki, dan memvalidasi model statistik yang digunakan.

2. Pemilihan teknik validasi yang tepat pada evaluasi model bergantung pada ukuran dataset, jumlah sampel yang tersedia, dan tujuan spesifik dari analisis yang dilakukan. Teknik validasi model dapat membantu kita dalam menguji dan memvalidasi kinerja model secara obyektif, sehingga memastikan bahwa model yang digunakan memberikan hasil yang dapat diandalkan dan berguna dalam konteks yang relevan.

Referensi

Witten, I. H., Frank, E., Hall, M. A., & Pal, C. J. (2016). Data Mining: Practical Machine Learning Tools and Techniques (edisi ke-4). Morgan Kaufmann.

Han, J., Kamber, M., & Pei, J. (2011). Data Mining: Concepts and Techniques (edisi ke-3). Morgan Kaufmann.

Sampai disini dulu penjelasan terkait Evaluasi Model dalam Statistik. Jika masih terdapat hal-hal yang dibingungkan bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya.

Sstt...
Mau Kiriman Artikel Terbaru Exsight
Tanpa Biaya Langganan? ????

Nama Kamu

Email Kamu

Dapatkan Akses Informasi Terupdate Seputar Dunia Data dan Statistika 🙂

Exsight ADS

Leave a Comment

Hubungi Admin
Halo, selamat datang di Exsight! 👋

Hari ini kita ada DISKON 20% untuk semua transaksi. Klaim sekarang!