Algoritma Naive Bayes dalam Machine Learning #1

DW ADS

Coba bayangkan, misal sobat Exsight mempunyai sebuah kotak tertutup yang berisi bola-bola dengan warna yang berbeda. Misalnya, jika kita sudah tahu bahwa dalam kotak tersebut sebagian besar berisi bola merah dan sedikit bola biru. Kemudian, kita ingin tahu, ketika kita mengambil bola dari kotak itu, bola apa yang akan keluar?

Nah, dengan menggunakan algoritma Naive Bayes kita bisa menebak warna bola di dalam kotak dengan cara yang sederhana dan cepat berdasarkan informasi (pengalaman) yang sudah kita punya. Pada artikel ini akan dibahas lebih mendalam terkait algoritma Naive Bayes dalam machine learning. Maka dari itu, simak dengan seksama yaa!

Definisi

Naive Bayes merupakan algoritma dalam machine learning yang berbasis probabilitas berdasarkan teorema Bayes yang digunakan untuk klasifikasi serta memprediksi probabilitas kelas atau label tertentu berdasarkan fitur-fitur (variabel) yang ada.

Konsep Dasar Naive Bayes

Beberapa konsep dasar dari algoritma Naive Bayes diantaranya sebagai berikut.

A. Teorema Bayes
Algoritma Naive Bayes didasarkan pada Teorema Bayes. Teorema Bayes digunakan untuk menghitung probabilitas suatu peristiwa berdasarkan informasi sebelumnya tentang peristiwa tersebut.

B. Klasifikasi
Algoritma Naive Bayes digunakan dalam konteks klasifikasi, di mana kita dapat mengklasifikasikan data ke dalam salah satu dari beberapa kelas atau label yang ada. Misalnya, mengklasifikasikan email sebagai “spam” atau “bukan spam.”

C. Asumsi Independensi
Dalam algoritma Naive Bayes terdapat asumsi sederhana bahwa semua fitur (variabel) dalam data bersifat independen atau tidak saling bergantung satu sama lain.

D. Penghitungan Probabilitas
Algoritma Naive Bayes memiliki dua jenis probabilitas, yaitu probabilitas prior dan probabilitas kondisional. Contoh:
* Probabilitas Prior
Probabilitas prior merupakan probabilitas awal dari masing-masing kelas tanpa mempertimbangkan fitur (variabel). Misalnya, probabilitas awal bahwa email adalah “spam.”

*Probabilitas Kondisional
Probabilitas kondisional merupakan probabilitas kelas berdasarkan fitur (variabel) yang diamati. Misalnya, probabilitas bahwa email adalah “spam” jika mengandung kata-kata tertentu.

E. Pemilihan Kelas
Setelah menghitung probabilitas untuk setiap kelas, algoritma Naive Bayes dapat memilih kelas dengan probabilitas tertinggi sebagai prediksi. Dalam contoh email “spam” atau “bukan spam,” algoritma Naive Bayes akan memilih kelas dengan probabilitas tertinggi.

F. Kinerja dan Evaluasi
Hasil kinerja dan evaluasi dari algoritma Naive Bayes dapat diukur dengan menggunakan berbagai metrik evaluasi seperti akurasi, presisi, recall, F1-score, dan confusion matrix.

Kelebihan dan Keterbatasan

Algoritma Naive Bayes memiliki sejumlah kelebihan dan keterbatasan diantaranya:

Kelebihan

  1. Sederhana dan Cepat
    Naive Bayes merupakan salah satu algoritma yang paling sederhana dalam machine learning. Algoritma Naive Bayes menggunakan perhitungan probabilitas relatif sederhana, sehingga waktu komputasi yang dibutuhkan untuk algoritma ini cukup cepat.
  2. Cocok untuk Data Dimensi Tinggi
    Naive Bayes dapat bekerja dengan baik meskipun data memiliki banyak fitur/variabel (data dimensi tinggi).
  3. Kemampuan Menangani Data Kategorikal
    Naive Bayes cocok digunakan pada data dengan tipe kategorikal atau biner.
  4. Kinerja yang Baik pada Data Terdistribusi Tidak Merata
    Algoritma Naive Bayes dapat berfungsi dengan baik pada dataset di mana kelasnya tidak terdistribusi merata.

Keterbatasan

  1. Kurang Efektif pada Data Kontinu
    Algoritma Naive Bayes kurang efektif dalam menangani data kontinu yang memerlukan asumsi distribusi probabilitas tertentu.
  2. Sensitif terhadap Fitur Irrelevant
    Algoritma Naive Bayes cenderung memperhatikan semua fitur/variabel yang ada dalam data, termasuk fitur-fitur yang sebenarnya tidak memiliki hubungan kuat atau penting dengan klasifikasi atau prediksi yang ingin dilakukan.
  3. Kinerja Rendah pada Data Langka
    Pada dataset dengan frekuensi nol untuk beberapa kombinasi fitur-kelas, algoritma Naive Bayes dapat memberikan hasil yang buruk.
  4. Memerlukan Data Training yang Cukup
    Algoritma ini memerlukan data training yang cukup besar untuk menghasilkan hasil yang baik. Jika data training sangat terbatas, performa Naive Bayes dapat menjadi kurang memuaskan.

Penerapan Naive Bayes

Algoritma Naive Bayes memiliki berbagai penerapan dalam berbagai bidang. Berikut adalah beberapa contoh penerapannya:

1. Deteksi Spam Email
Salah satu penerapan paling terkenal dari Naive Bayes adalah dalam deteksi spam email. Algoritma ini dapat mempelajari pola dari email yang telah dikategorikan sebagai “spam” atau “bukan spam” dan kemudian menggunakan pengetahuannya untuk mengklasifikasikan email baru.

naive bayes

2. Klasifikasi Sentimen dalam Analisis Teks
Algoritma Naive Bayes dapat digunakan untuk klasifikasi sentimen positif, negatif maupun netral pada data teks yang terdapat dalam media sosial, ulasan produk, maupun komentar online. Adanya klasifikasi sentimen dalam analisis teks dapat membantu perusahaan memahami pandangan dan umpan balik pelanggan.

naive bayes

3. Diagnostik Kesehatan
Dalam dunia medis, Naive Bayes digunakan dalam sistem diagnostik untuk membantu dokter dalam mendiagnosis penyakit, menganalisis data medis dan mengidentifikasi potensi penyakit berdasarkan gejala.

naive bayes

Penerapan Naive Bayes sangatlah bervariasi, dimana hal ini tergantung pada jenis data dan masalah yang dihadapi.

Referensi

Taheri, S., & Mammadov, M. (2013). Learning The Naïve Bayes Classifier with Optimization Models, International Journal of Applied Mathematics and Computer Science, 23(4).

Pamungkas, K., Aridinanti, L., & Wibowo, W. (2022). Analisis Sentimen Pelaporan Masyarakat di Situs Media Centre Surabaya dengan Naive Bayes Classifier. Jurnal Teknik ITS, Vol.11, No. 2.

Sampai disini dulu penjelasan terkait Algoritma Naive Bayes dalam Machine Learning. Jika masih ada yang dibingungkan bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya.

Sstt...
Mau Kiriman Artikel Terbaru Exsight
Tanpa Biaya Langganan? ????

Nama Kamu

Email Kamu

Dapatkan Akses Informasi Terupdate Seputar Dunia Data dan Statistika 🙂

Exsight ADS

1 thought on “Algoritma Naive Bayes dalam Machine Learning #1”

  1. Pingback: Tutorial Algoritma Naive Bayes Dengan R #2 - Exsight

Leave a Comment

Hubungi Admin
Halo, selamat datang di Exsight! 👋

Hari ini kita ada DISKON 20% untuk semua transaksi. Klaim sekarang!