Analisis Diskriminan (Part 1)

DW ADS

Halo, halo sobat Exsight! Jika kita bicara soal data, pasti kita penasaran dengan cerita apa yang disembunyikan di balik angka-angka dan fakta-fakta yang kita punya, kan? Nah, pada artikel kali ini kita akan membahas tentang Analisis Diskriminan, sebuah metode keren yang digunakan untuk menggali harta karun dari data yang kita miliki.

Bayangkan saja, ketika kita punya sejumlah besar informasi tentang berbagai kelompok orang atau objek, seperti karakteristik mereka, minat, atau bahkan prestasi, dengan menggunakan metode statistika, yaitu Analisis Diskriminan, kita dapat mengidentifikasi pola dan perbedaan di antara kelompok-kelompok ini.

Pada artikel ini, selain akan dibahas tentang apa itu diskriminan secara teoritis, dalam hal ini dilengkapi pula tutorial analisis diskriminan dengan SPSS. Maka dari itu, simak dengan seksama yaa!

Definisi

Analisis diskriminan merupakan sebuah metode statistik multivariat yang digunakan untuk menentukan perbedaan atau diskriminasi antara dua atau lebih kelompok berbeda berdasarkan pada variabel-variabel yang telah ditentukan sebelumnya. Pada analisis diskriminan, variabel-variabel yang digunakan saling bergantung satu sama lain (dependen). Variabel-variabel dalam analisis diskriminan terdiri atas variabel dependen dan variabel independen. Variabel dependen melibatkan data kategorik atau kualitatif (ordinal atau nominal), sedangkan variabel independen berupa data kuantitatif (interval atau rasio).

Tujuan dari analisis diskriminan adalah untuk menemukan kombinasi linear atau non-linear dari variabel-variabel independen yang paling baik dapat memisahkan atau membedakan antara kelompok-kelompok tersebut. Metode diskriminan seringkali digunakan dalam klasifikasi atau pengelompokan data ke dalam kategori atau kelas yang berbeda berdasarkan karakteristik atau atribut tertentu yang diamati.

Konsep Dasar

Konsep dasar dari analisis diskriminan yakni melibatkan teknik statistik yang digunakan untuk membedakan atau mengklasifikasikan objek atau individu ke dalam dua atau lebih kelompok berbeda berdasarkan pada variabel-variabel yang telah ditentukan sebelumnya. Berikut adalah beberapa konsep dasar dalam analisis diskriminan:

  1. Tujuan Utama:
    • Mengidentifikasi variabel atau atribut yang paling membedakan antara kelompok-kelompok yang diamati.
    • Memahami bagaimana variabel-variabel tersebut digunakan untuk memisahkan atau mengklasifikasikan objek ke dalam kelompok yang sesuai.
  2. Variabel Dependen:
    • Variabel dependen dalam analisis diskriminan adalah variabel kategorikal yang menggambarkan kelompok-kelompok yang akan diprediksi atau diklasifikasikan.
  3. Variabel Independen:
    • Variabel independen adalah variabel atau atribut yang digunakan untuk membedakan atau memisahkan kelompok-kelompok yang berbeda. Variabel ini bisa bersifat numerik atau kategorikal.
  4. Fungsi Diskriminan:
    • Tujuan utama analisis ini adalah untuk menemukan fungsi diskriminan yang optimal, baik linier maupun non-linier, yang dapat memaksimalkan pemisahan antara kelompok-kelompok yang berbeda.
  5. Evaluasi dan Interpretasi:
    • Setelah analisis dilakukan, evaluasi dilakukan terhadap kinerja model dalam membedakan kelompok-kelompok.
    • Variabel mana yang memiliki pengaruh yang paling besar dalam membedakan kelompok juga dievaluasi dan diinterpretasikan.

Analisis diskriminan dapat membantu kita dalam mengklasifikasikan objek atau individu ke dalam kelompok-kelompok berbeda berdasarkan karakteristik atau atribut tertentu yang diamati.

Jenis- Jenis Analisis Diskriminan

Jenis-jenis analisis diskriminan dapat dibagi menjadi beberapa kategori berdasarkan pendekatannya dan cara penerapannya. Berikut adalah beberapa jenis analisis diskriminan:

A. Analisis Diskriminan Linier
Metode ini menggunakan pendekatan linier untuk memisahkan atau membedakan antara kelompok-kelompok yang berbeda berdasarkan kombinasi linier dari variabel-variabel independen. Tujuan utamanya adalah untuk menemukan fungsi linear yang paling baik dalam membedakan antara kategori-kategori yang ada.

B. Analisis Diskriminan Non-Linier
Berbeda dengan analisis diskriminan linier, analisis diskriminan non- linier lebih fleksibel dan dapat menangani pola yang tidak dapat diuraikan secara linier.

C. Analisis Diskriminan Berganda
Dalam analisis diskriminan berganda, terdapat lebih dari dua kelompok atau kategori yang dipertimbangkan. Metode ini berfokus pada pemisahan atau klasifikasi lebih dari dua kelompok dengan menggunakan beberapa variabel independen sekaligus.

Setiap jenis analisis diskriminan memiliki kelebihan dan kelemahan serta dapat lebih tepat digunakan tergantung pada kondisi data yang dimiliki serta tujuan analisis yang ingin dicapai.

Kelebihan dan Kelemahan

Terdapat beberapa kelebihan dan kelemahan dalam analisis diskriminan diantaranya sebagai berikut.

Kelebihan

  1. Mampu Mengelompokkan Data
    Analisis diskriminan dapat memisahkan atau mengelompokkan data ke dalam kategori-kategori yang berbeda berdasarkan pada variabel-variabel yang relevan. Analisis diskriminan dapat membantu kita dalam identifikasi pola atau perbedaan antara kelompok-kelompok tersebut.
  2. Fleksibel dalam Penggunaan Variabel
    Metode ini memungkinkan penggunaan berbagai jenis variabel, baik numerik maupun kategorikal, sehingga memberikan keleluasaan dalam analisis terhadap berbagai jenis data.
  3. Mendukung Pengambilan Keputusan
    Dapat memberikan wawasan yang mendalam terhadap variabel-variabel yang paling berpengaruh dalam membedakan antara kelompok-kelompok yang diamati. Selain itu, dapat membantu kita dalam pengambilan keputusan.
  4. Mengatasi Asumsi Normalitas dan Homogenitas Varians
    Analisis diskriminan tidak bergantung pada asumsi normalitas distribusi data atau homogenitas varians, sehingga lebih robust terhadap pelanggaran asumsi tersebut.

Kelemahan

  1. Sensitif terhadap Outlier
    Analisis diskriminan dapat dipengaruhi oleh data pencilan (outlier) yang dapat memengaruhi akurasi dan validitas hasil analisis.
  2. Memerlukan Jumlah Sampel yang Cukup
    Untuk memberikan hasil yang akurat dan dapat diandalkan, analisis diskriminan memerlukan jumlah sampel yang memadai di setiap kelompok sehingga kurangnya data dapat mempengaruhi hasilnya.
  3. Memerlukan Asumsi Non-Multikolinieritas
    Metode ini mengharapkan bahwa variabel-variabel yang digunakan tidak terlalu berkorelasi satu sama lain (multikolinieritas), jika terdapat korelasi tinggi, dapat menyulitkan interpretasi hasil.
  4. Tidak Mengidentifikasi Sebab-Akibat
    Analisis diskriminan hanya mengidentifikasi perbedaan antara kelompok-kelompok tanpa menentukan hubungan sebab-akibat di antara variabel-variabel tersebut.

Penerapan Analisis Diskriminan

Analisis diskriminan memiliki berbagai penerapan yang luas dalam berbagai bidang. Berikut adalah beberapa contoh penerapannya:

A. Bisnis dan Pemasaran

analisis diskriminan
  • Memahami profil pelanggan untuk mengidentifikasi preferensi pembelian atau perilaku belanja yang berbeda.
  • Menganalisis faktor-faktor yang mempengaruhi keberhasilan atau kegagalan produk di pasar.
  • Segmentasi pasar untuk mengidentifikasi karakteristik khusus dari kelompok konsumen yang berbeda.

B. Sumber Daya Manusia dan Manajemen SDM

analisis diskriminan
  • Memprediksi faktor-faktor yang memengaruhi karyawan untuk sukses dalam pekerjaan atau dalam mendapatkan promosi.
  • Mengidentifikasi atribut atau karakteristik yang paling berkaitan dengan tingkat kepuasan kerja.

C. Kesehatan dan Kedokteran

diskriminan
  • Menganalisis faktor-faktor yang membedakan antara pasien yang rentan terhadap suatu penyakit atau kondisi kesehatan tertentu.
  • Memahami variabel apa yang paling mempengaruhi hasil dari pengobatan tertentu.

D. Keuangan dan Ekonomi

diskriminan
  • Mengklasifikasikan kreditur berdasarkan risiko kredit.
  • Menentukan faktor-faktor yang mempengaruhi performa keuangan sebuah perusahaan atau sektor industri.

E. Ilmu Sosial dan Psikologi

diskriminan
  • Mengidentifikasi faktor-faktor yang berbeda di antara kelompok demografis dalam hal preferensi politik atau perilaku sosial.
  • Menganalisis variabel apa yang paling membedakan antara kelompok dalam psikologi manusia atau sosiologi.

Tutorial SPSS

Studi Kasus

Studi kasus yang akan kita gunakan dalam hal ini menggunakan data sampel terkait Lung Cancer (Kanker Paru-Paru) yang didapatkan dari situs kaggle.com, dimana data di-publish oleh Ms. Nancy Al Aswad.
* Tidak terdapat missing value pada data.
* Data terdiri atas 309 observasi.

Data terdiri atas 16 variabel yaitu:

VariabelKeterangan VariabelSkala Data
GenderM = Male
F = Female
Kategorik
AgeNumerik
Smoking1 = No
2 = Yes
Kategorik
Yellow Finger1 = No
2 = Yes
Kategorik
Anxiety1 = No
2 = Yes
Kategorik
Peer Pressure1 = No
2 = Yes
Kategorik
Chronic Disease1 = No
2 = Yes
Kategorik
Fatigue1 = No
2 = Yes
Kategorik
Allergy1 = No
2 = Yes
Kategorik
Wheezing1 = No
2 = Yes
Kategorik
Alcohol1 = No
2 = Yes
Kategorik
Coughing1 = No
2 = Yes
Kategorik
Shortness of Breath1 = No
2 = Yes
Kategorik
Swallowing Difficulty1 = No
2 = Yes
Kategorik
Chest Pain1 = No
2 = Yes
Kategorik
Lung Cancer1 = No
2 = Yes
Kategorik
Tabel 1. Data

Pada Tabel 1. variabel Lung Cancer berperan sebagai variabel Dependen, sedangkan lainnya merupakan variabel Independen.

Tutorial

1.Buka software SPSS, kemudian entry data pada variable view dan data view. 

diskriminan
Gambar 1a. SPSS Tahap 1 (Data View)

Pada bagian data view berisi data-data dari masing-masing variabel, sedangkan untuk bagian variable view berisi pendefinisian dari masing-masing (khususnya terkait jenis data pada bagian measure).

diskriminan
Gambar 1b. SPSS Tahap 1 (Variable View)

2. Tahapan selanjutnya klik Analyze â€“ klik Classifiy – klik Discriminant

diskriminan
Gambar 2. SPSS Tahap 2

3. Kemudian pada bagian Grouping Variables, kita isi dengan variabel dependen yaitu LUNG_CANCER, dalam hal ini untuk variabel LUNG_CANCER perlu kita definisikan terlebih dahulu, dengan cara klik Define Range.

diskriminan

Gambar 3. 
SPSS Tahap 3

4. Pada bagian Define Range, kita isikan nilai Minimum yaitu 1 (melambangkan kategori No) dan nilai Maksimum yaitu 2 (melambangkan kategori Yes)

diskriminan

Gambar 4. 
SPSS Tahap 4

5. Selanjutnya pada bagian Independents, kita isikan dengan variabel- variabel independen sebanyak 15 variabel sebagai berikut. Lalu kita pilih pada bagian Use stepwise method.

diskriminan

Gambar 5. 
SPSS Tahap 5

6. Mengacu pada Gambar 5., tahapan berikutnya klik pada bagian Statistics, sehingga muncul tampilan seperti pada Gambar 6. Apabila kita perhatikan pada Gambar 6, kita centang seluruh kotak, baik pada bagian Descriptive, Function Coefficients, dan Matrices. Lalu kita klik Continue.

diskriminan

Gambar 6. 
SPSS Tahap 6

7. Kita perhatikan kembali, mengacu pada Gambar 5, klik pada bagian Statistics, sehingga muncul tampilan seperti pada Gambar 7. Kita centang pada bagian Wilks’ lambda, Summary of steps, lalu pada bagian Criteria, kita pilih Use F Value dengan nilai Entry yaitu 3.84 dan nilai Removal yaitu 2.71. Lalu klik Continue.

diskriminan
Gambar 7. SPSS Tahap 7

8. Masih mengacu pada Gambar 5, klik pada bagian Classify, sehingga muncul tampilan seperti pada Gambar 8. Untuk bagian-bagian yang perlu dicentang, sesuaikan seperti pada Gambar 8.

diskriminan
 Gambar 8. SPSS Tahap 8

Selanjutnya klik Continue dan Klik OK.

Pembahasan Hasil Output SPSS

Setelah klik OK, maka didapatkan hasil output SPSS sebagai berikut.

diskriminan
Gambar 9. Hasil Output SPSS (1)

Hasil output pada Gambar 9. menunjukkan hasil uji kesamaan rata-rata variabel dalam hal ini menggunakan uji Wilks’ Lambda. Pada artikel ini, taraf signifikansi yang digunakan yaitu alfa 5% atau 0.05. Kriteria pengujian yang digunakan adalah sebagai berikut.

  • Apabila nilai Sig atau p-value > 0,05 maka tidak ada perbedaan dalam kelompok
  • Apabila nilai Sig atau p-value < 0,05 maka ada perbedaan dalam kelompok

Berdasarkan Gambar 9. diketahui bahwa variabel-variabel yang menunjukkan adanya perbedaan dalam kelompok atau dengan kata lain variabel independen yang memberikan perbedaan pada variabel dependen (LUNG_CANCER) yaitu variabel:
* YELLOW_FINGER
* ANXIETY
* PEER_PRESSURE
* FATIGUE
* ALLERGY
* WHEEZING
* ALCOHOL_CONSUMING
* COUGHING
* SWALLOWING_DIFFICULTY
* CHEST_PAIN

diskriminan
Gambar 10. Hasil Output SPSS (2)

Selanjutnya berdasarkan hasil output SPSS pada Gambar 10. diperoleh informasi bahwa nilai Canonical Correlation yaitu sebesar 0.620. Nilai canonical correlation digunakan untuk mengukur derajat hubungan antara hasil diskriminan atau besarnya variabilitas yang mampu diterangkan oleh variabel independen terhadap variabel dependen.

Apabila nilai canonical correlation sebesar 0,620 dikuadratkan (0,620 x 0,620) = 0.3844, artinya 38.44% varians dari variabel independen (kelompok) dapat dijelaskan dari model diskriminan yang terbentuk.

Nilai korelasi kanonikal menunjukan hubungan antara nilai diskriminan dengan kelompok. Nilai Canonical Correlation sebesar 0,620 berarti hubungannya cukup tinggi karena mendekati angka 1 (besarnya korelasi antara 0-1).

Referensi

Kartikawati, A., Mukid, M, A. & Ispriyanti, D. (2013). Perbandingan Analisis Diskriminan Linier Klasik dan Analisis Diskriminan Linier Robust untuk Pengklasifikasian Kesejahteraan Masyarakat Kabupaten/Kota di Jawa Tengah. Jurnal Gaussian, Vol. 2, No. 3.

Johnson, R. A., & Wichern, D. W. (2007). Applied Multivariate Statistical Analysis. Pearson Education.

Sampai disini dulu penjelasan terkait Analisis Diskriminan. Untuk interpretasi lanjutan terkait fungsi diskriminan yang terbentuk serta ukuran akurasi dari model akan dibahas pada bagian selanjutnya yaa.
Jika masih ada yang dibingungkan bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya.

Sstt...
Mau Kiriman Artikel Terbaru Exsight
Tanpa Biaya Langganan? ????

Nama Kamu

Email Kamu

Dapatkan Akses Informasi Terupdate Seputar Dunia Data dan Statistika 🙂

Exsight ADS

1 thought on “Analisis Diskriminan (Part 1)”

  1. Pingback: Analisis Diskriminan Dengan Software R (Part 2) - Exsight

Leave a Comment

Hubungi Admin
Halo, selamat datang di Exsight! đź‘‹

Hari ini kita ada DISKON 20% untuk semua transaksi. Klaim sekarang!