Hai hai sobat Exsight, dalam dunia statistik, terdapat fenomena yang seringkali menarik perhatian para peneliti dan praktisi, yaitu adanya nilai-nilai ekstrem atau yang dikenal dengan istilah Statistics Extreme Value (SEV). Fenomena ini melibatkan peristiwa-peristiwa langka atau ekstrem yang terjadi dalam suatu dataset, yang seringkali memiliki dampak besar dalam berbagai bidang, mulai dari ilmu lingkungan hingga keuangan.
Dalam artikel ini, kita akan menjelajahi konsep dasar statistik nilai ekstrem, mengapa fenomena ini penting, dan bagaimana statistik nilai ekstrem digunakan dalam berbagai konteks, mulai dari prediksi cuaca hingga manajemen risiko. Serta, kita akan membahas beberapa teknik dan metode analisis yang digunakan untuk mengatasi tantangan yang terkait dengan peristiwa-peristiwa ekstrem dalam data. Tanpa berlama- lama lagi, yuk simak artikel ini dengan seksama yaa!
Definisi
Statistics Extreme Value (SEV) merupakan suatu ilmu statistika yang mempelajari tentang terjadinya nilai-nilai ekstrem yang terjadi dalam kejadian di sekitar kita. Metode SEV dikembangkan untuk mengidentifikasi kejadian ekstrem dengan melihat pola dan karakteristik kejadian ekstrem. Kejadian ekstrem yang sedikit terjadi ini cenderung memiliki efek negatif yang signifikan, meskipun dalam waktu yang singkat, namun dapat memiliki dampak yang signifikan
Statistics Extreme Value pertama kali diperkenalkan oleh Frechet pada tahun 1927 Pada tahun berikutnya Fisher dan Tippet mengembangkan metode SEV. Selanjutnya, pada tahun 1943 metode SEV diformulasikan ulang oleh Gnedenko. SEV merupakan suatu metode yang menarik, biasanya diterapkan pada kejadian yang besar dalam peristiwa alam seperti curah hujan, banjir, dan polusi udara. Kejadian ekstrem merupakan peristiwa yang jarang terjadi namun peristiwa besar ini pada umumnya sulit untuk dipelajari. Dalam hal ini peluang terjadinya kejadian ekstrem dalam statistika dapat diprediksi menggunakan metode ini.
Konsep Dasar Statistics Extreme Value
Statistics Extreme Value (SEV) merupakan salah satu metode statistika yang digunakan untuk mempelajari perilaku ekor (tail) suatu distribusi untuk dapat menentukan probabilitas nilai-nilai ekstremnya. Data yang memiliki heavy tail diilustrasikan oleh Gambar 1 sebagai berikut.
Identifikasi nilai ekstrem menggunakan metode Statistics Extreme Value dapat dilakukan dengan dua metode yaitu:
A. Metode Block Maxima yang akan mengikuti distribusi Generalized Extreme Value (GEV)
B. Metode Peaks Over Threshold yang mengikuti Generalized Pareto Distribution (GPD).
Penjelasan lebih detail terkait Block Maxima dan Peaks Over Threshold adalah sebagai berikut.
A. Metode Block Maxima
Metode Block Maxima merupakan metode yang mengidentifikasi nilai ekstrem berdasarkan nilai tertinggi data observasi yang sudah dikelompokkan berdasarkan periode tertentu. Dalam metode Block Maxima, data amatan yang dimasukkan dalam sampel adalah pengamatan yang memiliki nilai tertinggi, karena nilai maksimum tersebut merupakan nilai ekstrem data dalam satu periode tertentu. Pada metode ini, data dibagi menjadi blok-blok pada periode tertentu seperti bulanan, semesteran, dan tahunan. Kemudian dipilih nilai tertinggi dari masing-masing blok yang disebut nilai ekstrem. Nilai tersebut dimasukkan sebagai sampel yang diperoleh dari metode Block Maxima . Ilustrasi selengkapnya dapat dilihat pada Gambar 2 di bawah ini.
Berdasarkan Gambar 2. diketahui bahwa data pada periode satu tahun dibagi menjadi dua blok. Dalam satu blok berisi enam bulan yang dimana setiap blok memiliki satu nilai ekstrem. Metode Block Maxima menggunakan teorema Fisher-Tippet Gnedenko (1928) yang menyatakan bahwa data sampel nilai ekstrem yang diambil dari metode Block Maxima akan mengikuti distribusi Generalized Extreme Value (GEV). Bentuk cumulative distribution function (cdf) dari distribusi Generalized Extreme Value (GEV) adalah sebagai berikut:
Distribusi GEV memiliki tiga parameter, yaitu parameter lokasi ( π ), parameter skala ( π ), dan parameter bentuk ( π ). Bentuk parameternya mengikuti 3 distribusi, yaitu distribusi Rev. Weibull (π < 0) , distribusi Gumbel (π = 0), dan distribusi Frechet (π > 0). Semakin tinggi nilai parameter bentuk (ΞΎ), maka akan terjadi ekor yang semakin tebal (heavy tail) sehingga menghasilkan nilai ekstrem yang lebih besar. Berdasarkan ketiga jenis distribusi Generalized Extreme Value (GEV) tersebut, distribusi Frechet merupakan distribusi yang sesuai karena memiliki heavy tail (π > 0).
B. Metode Peaks Over Threshold (POT)
Metode Peaks Over Threshold (POT) adalah metode lain yang digunakan dalam Statistics Extreme Value (SEV) untuk mengidentifikasi nilai ekstrem. Metode Peaks Over Threshold menggunakan nilai patokan atau yang biasa disebut dengan threshold. Metode Peaks Over Threshold yang mengikuti distribusi Generalized Pareto Distribution (GPD) diperkenalkan pertama kali oleh Picklands (1975) selanjutnya dipelajari oleh Davidson (1984). Teorema Pickland-Dalkema dan de Haan menyatakan bahwa apabila semakin tinggi nilai threshold maka distribusinya akan mengikuti distribusi Generalized Pareto Distribution (GPD).
f\left ( \xi ,\sigma |x \right )=\left\{\begin{matrix} \frac{1}{\sigma }\left (1+\frac{\xi x }{\sigma } \right )^{-\frac{1}{\xi }-1},\, \xi \neq 0\\ \frac{1}{\sigma }exp\left ( -\frac{x}{\sigma } \right ),\, \xi =0 \end{matrix},\right.
dimana 0 <= x < ~ jika π >= 0 dan 0 <= x < -Ο/π jika π < 0.
Generalized Pareto Distribution (GPD) memiliki dua parameter, yaitu parameter bentuk (π) dan parameter skala (Ο). Terdapat tiga tipe distribusi dalam GPD. Tipe 1 berdistribusi Eksponensial jika π = 0. Tipe 2 berdistribusi Pareto jika π > 0 dan tipe 3 berdistribusi Beta jika π < 0. Semakin besar nilai π maka distribusi akan memiliki ekor yang semakin gemuk. Sehingga peluang terjadinya nilai ekstrem pun semakin besar. Apabila π < 0 maka kejadian tersebut memiliki short tail dan jika π > 0 maka kejadian tersebut memiliki long tail.
Penentuan Nilai Threshold pada Peaks Over Threshold
Terdapat beberapa cara dalam menentukan nilai threshold diantaranya adalah Mean Residual Life Plot (MRLP), metode persentase, dan Sample Mean Excess Function (SMEF). Metode MRLP merupakan suatu metode dalam menentukan nilai threshold berdasarkan pada nilai rataan dari distribusi Generalized Pareto Distribution (GPD). SMEF adalah metode lain yang menentukan nilai threshold dengan menampilkan grafik. SMEF adalah estimasi dari fungsi rata-rata dari kelebihan data(data ekstrem). Metode yang lebih mudah digunakan dalam penentuan threshold adalah metode persentase. 10% dari data merupakan nilai kelebihan atau yang disebut dengan nilai ekstrem. Langkah-langkah metode persentase adalah sebagai berikut.
- Mengurutkan data dari yang terbesar hingga yang terkecil.
- Menghitung jumlah data ekstrem n = 10% x N dimana k adalah jumlah data ekstrem dan N adalah jumlah sampel data sehingga data yang berada di urutan 1 hingga n merupakan nilai ekstrem.
- Menentukan nilai threshold (u) yaitu u = n + 1 .
Kelebihan dan Kelemahan
Terdapat beberapa kelebihan dan kelemahan pada metode Statistics Extreme Value (SEV) diantaranya adalah sebagai berikut.
Kelebihan
- Menangani Data Raritas
Data raritas merupakan data yang mewakili peristiwa atau observasi yang sangat jarang terjadi dalam populasi atau sampel. Statistics Extreme Value memungkinkan analisis terhadap peristiwa yang jarang terjadi namun memiliki dampak besar. Hal ini penting dalam merencanakan mitigasi risiko dan pengambilan keputusan dalam situasi yang ekstrem. - Menghasilkan Estimasi yang Tepat
Metode Statistics Extreme Value mampu menghasilkan estimasi yang akurat terhadap nilai-nilai ekstrem dari distribusi data. Hal ini memungkinkan pemodelan yang lebih baik terhadap kemungkinan terjadinya kejadian ekstrem di masa depan. - Relevansi Praktis yang Tinggi
Data ekstrem sering kali memiliki implikasi praktis yang signifikan dalam berbagai bidang seperti keamanan, perencanaan infrastruktur, asuransi, dan manajemen bencana. Statistik ekstrem dapat membantu kita dalam pengambilan keputusan yang tepat di tengah situasi yang berpotensi berbahaya. - Memungkinkan Perbandingan Risiko
Dengan menggunakan statistik ekstrem, risiko dari berbagai kejadian ekstrem dapat dibandingkan secara langsung. Hal ini membantu dalam menetapkan prioritas penanganan risiko dan alokasi sumber daya yang efektif.
Kelemahan
- Ketergantungan pada Data Ekstrem
Statistics Extreme Value cenderung bergantung pada data yang langka dan terkadang sulit untuk dikumpulkan. Keterbatasan data dapat mempengaruhi akurasi dari estimasi dan analisis yang dihasilkan. - Sensitif terhadap Model
Metode Statistics Extreme Value sering kali memerlukan asumsi tertentu tentang distribusi data. Jika asumsi ini tidak terpenuhi, hasil analisis dapat menjadi tidak akurat. - Kompleksitas Metode
Beberapa teknik dalam Statistics Extreme Value, seperti metode maksimum likelihood, memerlukan pemahaman matematika yang cukup mendalam dan keterampilan komputasi yang tinggi. Hal ini dapat menjadi hambatan bagi pengguna yang kurang berpengalaman. - Keterbatasan dalam Memodelkan Perubahan
Statistics Extreme Value sering kali mengasumsikan bahwa distribusi data tetap stabil seiring waktu. Namun, dalam konteks perubahan iklim atau perubahan lingkungan lainnya, asumsi ini mungkin tidak berlaku, sehingga mempengaruhi akurasi prediksi kejadian ekstrem di masa depan.
Penerapan SEV dalam Berbagai Bidang
Statistics Extreme Value dapat diterapkan dalam berbagai bidang diantaranya adalah sebagai berikut.
A. Keamanan dan Keselamatan
Statistics Extreme Value digunakan untuk menganalisis risiko kecelakaan lalu lintas, kebakaran, atau kejahatan di lingkungan sekitar. Data ekstrem seperti jumlah kecelakaan fatal atau kejadian kriminal yang langka tetapi berdampak besar dapat membantu dalam merancang strategi keamanan dan langkah-langkah mitigasi risiko.
B. Asuransi
Perusahaan asuransi menggunakan Statistics Extreme Value (SEV) untuk menilai risiko dan menetapkan premi asuransi. Data tentang klaim langka tetapi besar seperti kerugian akibat bencana alam atau kecelakaan pesawat dapat membantu dalam menentukan tarif asuransi yang sesuai.
C. Kesehatan Masyarakat
Dalam bidang kesehatan masyarakat, Statistics Extreme Value (SEV) digunakan untuk memantau dan mengelola wabah penyakit yang langka tetapi berpotensi mematikan. Misalnya, Statistics Extreme Value (SEV) dapat digunakan untuk memprediksi penyebaran penyakit menular atau kejadian luar biasa seperti pandemi.
D. Bisnis dan Keuangan
Statistics Extreme Value (SEV) dapat membantu perusahaan dalam merencanakan dan mengelola risiko keuangan. Penggunaannya mencakup pemodelan risiko pasar, evaluasi potensi kerugian investasi, dan pengambilan keputusan strategis dalam kondisi pasar yang ekstrem.
E. Pengelolaan Lingkungan
Statistics Extreme Value (SEV) digunakan dalam pengelolaan lingkungan untuk memahami perubahan iklim, mengidentifikasi zona risiko bencana alam seperti banjir atau tanah longsor, serta merencanakan tindakan mitigasi untuk melindungi ekosistem yang rentan.
Referensi
Sekian penjelasan terkait Statistics Extreme Value (SEV). Jika masih ada yang dibingungkan bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya.