Distribusi Bernoulli: Serba – Serbi Distribusi
Distribusi Bernoulli — Coba sobat Exsight bayangkan ketika sedang bermain lempar koin dengan teman. Ketika kita melempar koin tersebut, terdapat dua kemungkinan hasil tampilan koin: yaitu muncul gambar atau angka. Dalam hal ini, hasil ini tidak bisa ditebak sebelumnya, tapi kita tahu bahwa ada kemungkinan 50-50 untuk masing-masing. Inilah salah satu contoh sederhana dari distribusi Bernoulli, yaitu sebuah konsep dalam statistik yang menggambarkan kejadian dengan hanya dua kemungkinan: sukses atau gagal.
Distribusi Bernoulli banyak ditemukan dalam kehidupan sehari-hari, bukan hanya dalam permainan. Misalnya, apakah seseorang berhasil lulus ujian atau tidak, apakah lampu di ruangan hidup atau mati, dan bahkan apakah sebuah produk yang diuji berfungsi atau gagal. Semua ini adalah peristiwa dengan dua kemungkinan, dan bisa digambarkan dengan distribusi Bernoulli.
Dalam artikel ini, kita akan membahas lebih dalam terkait apa itu distribusi Bernoulli, mengapa distribusi ini penting, serta bagaimana kita bisa menggunakan konsep sederhana ini untuk mempelajari berbagai hal di dunia nyata. Yuk yuk simak artikel ini dengan seksama yaa!
Konsep Dasar
Distribusi Bernoulli merupakan distribusi probabilitas diskrit yang menggambarkan hasil dari sebuah percobaan tunggal yang hanya memiliki dua kemungkinan hasil yaitu : sukses (biasanya dilambangkan dengan angka 1) atau gagal (biasanya dilambangkan dengan angka 0).
Dalam distribusi Bernoulli, Probabilitas keberhasilan dinyatakan dengan p (dengan nilai 0≤ p ≤1 ), sedangkan probabilitas kegagalan dinyatakan dengan 1−p
P\left ( X=x \right )=p _{i}^{x}\left ( 1-p \right )^{1-x}\, ,x=0,1
Nilai Harapan (Ekspetasi) Distribusi Bernoulli
Nilai harapan atau ekspektasi adalah rata-rata teoretis dari hasil suatu percobaan acak jika percobaan tersebut dilakukan berkali-kali dalam kondisi yang sama. Kita akan menggunakan pemisalan sederhana, misalnya sobat Exsight melempar koin 100 kali. Jika kemungkinan muncul sisi koin bagian Gambar adalah 50%, maka dari 100 lemparan, secara rata-rata kita mengharapkan 50 kali muncul sisi koin Gambar. Ini adalah ekspektasi. Adapun penjabaran rumus nilai harapan (ekspetasi) dari distribusi Bernoulli adalah sebagai berikut.
\begin{matrix} E\left ( X \right )=\sum_{x=0}^{1}x.f\left ( x \right ) \\\\ E\left(X\right)=\sum_{x=0}^{1}x.p^{x}\left ( 1-p \right )^{1-x}\\\\ E\left(X\right)=\left ( 0.p^{0}\left ( 1-p \right )^{1-0} \right )+\left ( 1.p^{1}\left ( 1-p \right )^{1-1} \right ) \\\\ E\left ( X \right )=0+p=p\end{matrix}
Varians Distribusi Bernoulli
Varians adalah ukuran seberapa jauh hasil-hasil percobaan menyebar dari nilai rata-rata (ekspektasi). Varians menunjukkan tingkat ketidakpastian atau keragaman data.
Kita akan menggunakan pemisalan sederhana yaitu sebagai berikut, misalnya sobat Exsight melempar dadu. Dalam hal ini misal nilai ekspektasi (rata-rata) percobaan hasilnya adalah 3.5, tetapi hasilnya bisa 1, 2, 6, dll. Varians membantu kita memahami seberapa jauh angka-angka itu tersebar dari rata-rata 3.5. Adapun penjabaran rumus varians dari distribusi Bernoulli adalah sebagai berikut.
\begin{matrix} Var\left ( X \right )=E\left [ \left ( X-E\left ( X \right ) \right ) ^{2} \right ] \\\\ Var(X)=E(X^{2})-2E(X)E(X)+(E(X))^{2}\\\\ Var(X)=E\left ( X^{2} \right )-\left ( E\left ( X \right ) \right )^{2} \\\\ Var(X)=p-p^2 \\\\ Var(X)=p(1-p)=pq\end{matrix}
sebagai catatan dalam penulisan rumus varians untuk E(X2) didapatkan dari
\begin{matrix} E(X^2)=\sum_{x=0}^{1}x^2.f(x) \\\\ E(X^2)=\sum_{x=0}^{1}x^2.p^x(1-p)^{1-x}\end{matrix}
Kelebihan dan Kelemahan
Terdapat beberapa kelebihan dalam Distribusi Bernoulli diantaranya adalah sebagai berikut.
Kelebihan
- Sederhana dan Mudah Dipahami
Distribusi Bernoulli hanya melibatkan dua hasil (sukses dan gagal), sehingga konsepnya mudah dipahami dan digunakan dalam analisis dasar. - Dasar untuk Distribusi Lain
Distribusi Bernoulli merupakan dasar bagi distribusi yang lebih kompleks, seperti distribusi Binomial, yang terdiri dari serangkaian percobaan Bernoulli. - Aplikasi Luas dalam Kehidupan Nyata
Distribusi Bernoulli digunakan dalam berbagai contoh praktis, seperti survei biner (jawaban ya/tidak) dan pengujian keberhasilan/kegagalan dalam eksperimen. - Penerapan dalam Model Statistik dan Machine Learning
Distribusi Bernoulli menjadi fondasi penting dalam model seperti regresi logistik, yang digunakan untuk klasifikasi biner.
Kelemahan
- Terbatas pada Dua Hasil
Distribusi Bernoulli hanya berlaku untuk peristiwa yang memiliki dua kemungkinan hasil. Hal ini membuat distibusi Bernoulli tidak cocok untuk situasi yang melibatkan lebih dari dua hasil atau hasil yang kontinu. - Tidak Fleksibel untuk Data Kompleks
Ketika data yang dianalisis memiliki kompleksitas lebih tinggi atau memerlukan distribusi probabilitas yang berbeda, distribusi Bernoulli tidak dapat memenuhi kebutuhan tersebut. - Asumsi Probabilitas Konstan
Distribusi ini mengasumsikan bahwa probabilitas sukses tetap konstan di setiap percobaan. Padahal dalam kenyataannya, probabilitas ini mungkin berubah-ubah dalam kondisi tertentu, sehingga distribusi Bernoulli tidak dapat menggambarkannya dengan akurat. - Informasi yang Terbatas
Distribusi Bernoulli hanya memberikan informasi dasar seperti nilai harapan dan varians. Untuk analisis yang memerlukan parameter lebih kompleks atau deskripsi yang lebih mendetail, distribusi ini kurang memadai.
Contoh Penggunaan Distribusi Bernoulli
A. Lemparan Koin
Salah satu contoh klasik adalah lemparan koin, di mana probabilitas keluar gambar adalah p=0.5 (sukses) dan angka adalah 1−p=0.5 (gagal).
B. Keberhasilan Produk
Jika sebuah produk diuji, hasilnya bisa sukses (produk berfungsi) atau gagal (produk cacat). Probabilitas keberhasilan produk, misalnya, bisa p=0.8, sedangkan probabilitas kegagalannya adalah 1−p=0.2.
C. Tes Medis
Hasil tes medis yang menunjukkan positif (sukses) atau negatif (gagal) untuk mendeteksi suatu kondisi tertentu dapat dimodelkan dengan distribusi Bernoulli.
D. Sistem Deteksi Penipuan (Fraud Detection)
Dalam sistem pembayaran online, setiap transaksi dapat diklasifikasikan sebagai transaksi penipuan (fraudulent) atau bukan. Misal penipuan disimbolkan 1 lalu bukan penipuan disimbolkan 0. Penerapan penggunaan model dengan distribusi Bernoulli dapat memprediksi probabilitas apakah transaksi tertentu adalah penipuan berdasarkan pola pengguna atau atribut transaksi.
E. Prediksi Keputusan Pelanggan
Perusahaan dapat memodelkan apakah pelanggan akan membeli produk tertentu atau tidak berdasarkan riwayat pembelian mereka dan faktor lain seperti harga atau promosi. Misalnya jika pelanggan membeli disimbolkan dengan 1 lalu jika pelanggan tidak membeli disimbolkan 0. Distribusi Bernoulli membantu memprediksi keputusan pelanggan untuk meningkatkan strategi pemasaran.
Pengembangan Distribusi Bernoulli dalam Pemodelan Statistik
Distribusi Bernoulli merupakan salah satu distribusi probabilitas paling dasar dalam statistik. Sederhananya, distribusi ini memodelkan situasi di mana ada dua hasil yang mungkin, seperti ya/tidak, sukses/gagal, atau 1/0. Walaupun sederhana, distribusi Bernoulli menjadi fondasi untuk banyak pengembangan dalam analisis data dan pemodelan statistik. Beberapa contoh pemodelan statistik yang menerapkan distribusi Bernoulli diantaranya adalah sebagai berikut.
A. REGRESI LOGISTIK BINER
Model regresi logistik biner digunakan jika variabel responnya (Y) merupakan variabel dikotomous/biner atau bila variabel respon menghasilkan dua kategori bernilai 0 atau 1. Apabila variabel Y menghasilkan dua kategori maka variabel respon tersebut mengikuti distribusi Bernoulli
B. NAIVE BAYES BERNOULLI
Distribusi Bernoulli juga dapat diterapkan dalam Machine Learning. Naive Bayes dengan asumsi Bernoulli digunakan dalam klasifikasi biner, terutama untuk data biner seperti teks. Dalam pemrosesan teks, setiap kata dalam dokumen dianggap sebagai variabel biner (ada atau tidak). Sebagai contoh, misalnya kita ingin memprediksi apakah sebuah email adalah spam atau bukan berdasarkan kata-kata tertentu yang ada di dalamnya. Jika distribusi kata-kata ini diwakili dengan Bernoulli (ada/tidak), Naive Bayes Bernoulli bisa digunakan.
C. Model Hidden Markov
Dalam model Hidden Markov. probabilitas transisi antar status atau probabilitas keluaran (emission probability) sering menggunakan distribusi Bernoulli jika hasilnya biner. Untuk lebih memudahkan pemahaman sobat Exsight, misalnya kita menggunakan ilustrasi sederhana dimana sebuah aplikasi ingin memodelkan pola aktif/tidak aktif seorang pengguna selama satu minggu. Setiap hari, status pengguna (aktif atau tidak aktif) bisa dimodelkan menggunakan distribusi Bernoulli.
Contoh Soal dengan Menerapkan Distribusi Bernoulli
Untuk lebih meningkatkan pemahaman sobat Exsight tentang Distribusi Bernoulli, sekarang kita akan mencoba menyelesaikan suatu case study yang melibatkan distribusi Bernoulli sebagai berikut.
Case Study
Seorang dokter sedang menguji sebuah alat diagnostik untuk mendeteksi penyakit tertentu. Alat ini memiliki tingkat keberhasilan mendeteksi penyakit (positif benar) sebesar 80% atau p=0.8. Dokter melakukan satu kali uji terhadap pasien.
- Tentukan peluang bahwa alat diagnostik:
a. Memberikan hasil yang benar (positif benar).
b. Memberikan hasil yang salah (negatif palsu). - Hitung nilai harapan (E(X)) dan varians (Var(X)) dari percobaan ini.
- Jika alat diagnostik diuji 100 kali terhadap pasien yang benar-benar memiliki penyakit, berapa rata-rata jumlah hasil yang benar diharapkan?
Pembahasan
NOMOR 1
Distribusi Bernoulli memiliki dua kemungkinan hasil:
* Sukses (X=1): Alat diagnostik memberikan hasil yang benar (positif benar).
* Gagal (X=0): Alat diagnostik memberikan hasil yang salah (negatif palsu).
Untuk menentukan peluang dalam hal ini kita akan menggunakan rumus fungsi probabilitas distribusi Bernoulli. Maka dapat dihitung
a. Peluang Alat Memberikan Hasil yang benar (X=1)
P\left ( X=1 \right )=p^{1}\left ( 1-p \right )^{1-1}=(0.8)^1(1-0.8)^0=0.8
Jadi, peluang alat memberikan hasil yang benar adalah 80% atau 0.8.
b. Peluang Alat Memberikan Hasil yang salah (X=0)
P\left ( X=0 \right )=p^{0}\left ( 1-p \right )^{1-0}=(0.8)^0(1-0.8)^1=0.2
Jadi, peluang alat memberikan hasil yang salah adalah 20% atau 0.2.
NOMOR 2
Nilai Harapan E(X) dari Percobaan dapat dihitung sebagai berikut
E(X) = p = 0.8
Artinya, rata-rata dari hasil percobaan menunjukkan alat berhasil mendeteksi dengan benar sebesar 80%.
Varians (Var (X)) dari percobaan dapat dihitung sebagai berikut.
Var(X) = p (1-p) = (0.8)(1-0.8) = (0.8)(0.2) = 0.16
Sehingga didapatkan nilai varians dari hasil percobaan yaitu sebesar 0.16.
NOMOR 3
Rata-rata jumlah hasil benar yang diharapkan dari 100 kali percobaan (n= 100) dapat dihitung sebagai berikut.
Rata-Rata \ Jumlah \ Hasil \ Benar = n \times p = 100 \times 0.8 = 80
Artinya, dari 100 uji coba, rata-rata alat ini diharapkan memberikan hasil yang benar sebanyak 80 kali.
Referensi
Sekian penjelasan terkait Distrubsi Bernoulli. Apabila masih ada yang dibingungkan bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya. Bye bye!
Distribusi Bernoulli: Serba – Serbi Distribusi Read More »