Principal Component Analysis — Bayangkan sobat Exsight sedang mengunjungi sebuah perpustakaan raksasa dengan ribuan buku yang tersebar di berbagai rak. Setiap buku berisi informasi penting, namun untuk menemukan buku yang tepat di antara sekian banyak pilihan bisa menjadi tantangan yang sulit. Kemudian, bayangkan ada seorang pustakawan cerdas yang mampu menyusun ulang perpustakaan tersebut sehingga hanya dengan beberapa panduan sederhana, sobat Exsight bisa menemukan semua informasi yang Anda butuhkan dengan mudah. Dalam dunia analisis statistik, pustakawan cerdas ini dikenal sebagai Principal Component Analysis (PCA).
Principal Component Analysis (PCA) adalah teknik statistik yang digunakan untuk menyederhanakan kompleksitas data. PCA membantu kita menemukan pola-pola penting dalam dataset yang besar dan rumit, dengan cara mengurangi jumlah dimensi tanpa menghilangkan informasi yang berharga. Jadi, alih-alih bekerja dengan ratusan variabel yang membingungkan, PCA memungkinkan kita untuk fokus hanya pada beberapa “komponen utama” yang mewakili sebagian besar variasi dalam data.
Pada beberapa artikel Exsight yang sebelumnya, pernah disinggung terkait topik ini yaitu pada artikel dengan judul PCA (Principal Component Analysis). Nah, melanjutkan dari artikel yang lalu, sekarang kita akan fokus pada penerapan Principal Component Analysis melalui tutorial dengan software SPSS. Tanpa berlama-lama lagi, yuk simak artikel ini, dengan seksama yaa!
Definisi
Principal Component Analysis (PCA) seringkali disebut juga sebagai analisis komponen utama merupakan suatu metode statistik yang digunakan untuk mengurangi dimensi dari kumpulan data yang kompleks, yang saling berkorelasi satu sama lain, sehingga menjadi variabel baru (disebut dengan komponen utama) yang berukuran lebih kecil, namun mampu menerangkan sebagian besar keragaman total data, dan saling bebas satu sama lain
Adanya PCA memungkinkan data yang semula memiliki banyak dimensi (dimensi tinggi) untuk direpresentasikan dalam dimensi yang lebih rendah, sehingga memudahkan pemahaman dan analisis data.
Tutorial SPSS Principal Component Analysis
Studi Kasus
Studi kasus pada artikel kali ini akan menggunakan data yang merupakan data sekunder yang diperoleh dari situs website www.mvstats.com. Dataset HBAT terdiri atas 23 gabungan variabel kategorik dan kontinyu. Namun dalam pembahasan ini dilakukan hanya pada variabel kontinyu mulai variabel X6 hingga variabel X18 dimana masing-masing variabel terdiri atas 100 data. Dalam hal ini data bisa diakses disini.
Simbol | Variabel |
X6 | Product Quality |
X7 | E-Commerce |
X8 | Technical Support |
X9 | Complaint Resolution |
X10 | Advertising |
X11 | Product Line |
X12 | Salesforce Image |
X13 | Competitive Pricing |
X14 | Warranty & Claims |
X15 | Packaging |
X16 | Order & Biling |
X17 | Pricing Flexibility |
X18 | Delivery Speed |
1. Buka software SPSS, kemudian entry data pada variable view dan data view.
Pada bagian data view berisi data-data dari masing-masing variabel, sedangkan untuk bagian variable view berisi pendefinisian dari masing-masing (khususnya terkait jenis data pada bagian measure).
2. Tahapan SPSS yang perlu kita lakukan berikutnya yaitu klik Analyze, lalu kita klik Dimension Reduction, kemudian klik Factor. Selengkapnya bisa dilihat pada Gambar 2.
4. Selanjutnya akan muncul tampilan dialog box seperti halnya pada Gambar 3., dalam hal ini untuk bagian Variables kita isi dengan variabel X6 sampai dengan X18 . Jangan lupa, kita juga perlu klik pada bagian Extraction.
4. Apabila kita klik pada bagian Extraction, nantinya akan muncul tampilan seperti pada Gambar 4. Dalam hal ini, untuk bagian Method kita pilih bagian Principal Components, lalu untuk bagian Analyze kita pilih Correlation Model, serta untuk bagian Display kita beri tanda centang pada bagian Unrotated Factor Solution dan Scree Plot. Kemudian kita klik pada bagian Continue
5. Kemudian nantinya akan ditampilkan kembali tampilan seperti pada Gambar 3. Dalam hal ini, sekarang kita klik pada bagian Scores. Nantinya akan muncul tampilan seperti pada Gambar 5, yaitu (Factor Analysis: Factor Scores)
Pada Gambar 5. kita centang pada bagian Save as variables, Display factor score coefficient matrix, dan kita pilih pada bagian Regression. Lalu kita klik pada tombol Continue. Selanjutnya kita klik OK.
Pembahasan Hasil Output SPSS
Setelah klik OK, maka didapatkan hasil output SPSS sebagai berikut.
Berdasarkan hasil output SPSS pada Gambar 6 di atas terkait Total Variance Explained, didapatkan hasil varians initial eigenvalues menunjukkan jumlah variabel (yaitu 3,835 + 2,675 + 1,722 + 1,544 + 0,969 + 0,575 + 0,489 + 0,421 + 0,288 + 0,190 + 0,155 + 0,128 + 0,009 = 13 variabel).
Sedangkan pada bagian Extractions Sums of Squared Loadings menunjukkan jumlah variasi atau banyaknya faktor yang dapat dibentuk, Adapun bisa dilihat pada output terdapat empat variasi faktor yaitu 3,835 ; 2,675 ; 1,722 dan 1,544.
Berdasarkan hal tersebut maka 4 komponen yang dapat terbentuk dari 13 variabel yang dianalisis di mana nilai eigen value nya masing-masing lebih besar dari 1. Component 1 menjadi komponen yang mampu menjelaskan 29,503% variasi, component 2 mampu menjelaskan 20,577% variasi, lalu component 3 mampu menjelaskan 13,243% serta component 4 mampu menjelaskan variasi sebesar 11,876%.
Secara lebih lanjut, untuk penentuan jumlah komponen dalam Principal Component Analysis dapat ditampilkan secara visual melalui tampilan scree plot. Scree plot adalah grafik yang digunakan dalam Principal Component Analysis untuk membantu menentukan berapa banyak komponen utama yang harus dipertahankan dalam analisis. Scree plot sangat berguna dalam pengambilan keputusan terkait reduksi dimensi data. Grafik scree plot ditampilkan sebagai berikut.
Apabila kita perhatikan pada Gambar 7, terlihat bahwa grafik scree plot dapat dilihat untuk component number 1 , component number 2, lalu component number 3 dan component number 4 memiliki eigenvalue bernilai lebih dari 1. Sehingga dapat diartikan bahwa terdapat 4 komponen utama yang dapat dibentuk.
Visualisasi komponen-komponen utama melalui scree plot membantu dalam memahami struktur data secara intuitif, menunjukkan bagaimana observasi berkelompok berdasarkan skor komponen mereka.
Selain itu terdapat hasil output SPSS lainnya yaitu terkait Communalities seperti yang terdapat pada Gambar 8. Nilai extraction untuk sebagian besar variabel (kecuali variabel X15 – New Products) bernilai lebih besar dari 0,5 , hal ini dapat diartikan bahwa sebagian besar variabel penelitian dapat digunakan untuk menjelaskan komponen- komponen yang terbentuk.
Selanjunya perhitungan pada software SPSS ( Gambar 9.) menampilkan hasil output Component Matrix. Dalam hal ini, output Component Matrix di atas didapatkan berdasarkan principal components extraction method, di mana menunjukkan seberapa besar sebuah variabel berkorelasi dengan komponen utama yang akan dibentuk.
Berdasarkan output SPSS didapatkan pula Component Score Coefficient Matrix seperti yang ditampilkan pada Gambar 10. Component Score Coefficient Matrix menyediakan koefisien yang digunakan untuk menghitung skor komponen untuk setiap observasi atau kasus dalam dataset. Matriks ini berisi bobot yang digunakan dalam persamaan linier untuk membentuk skor komponen.
Dalam hal ini Component Score Coefficient Matrix digunakan untuk menghitung nilai atau skor komponen utama untuk setiap observasi dalam dataset. Selain itu dapat digunakan dalam menghasilkan skor komponen yang dapat digunakan sebagai variabel baru dalam analisis selanjutnya.
* Komponen Utama 1
Variabel Complaint Resolution (X9), Order & Billing (X16), Delivery Speed (X18) memiliki korelasi yang lebih tinggi terhadap komponen 1.
* Komponen Utama 2
Variabel Product Quality (X6), Product Line (X11), Competitive Pricing (X13) berkorelasi lebih tinggi terhadap komponen 2.
* Komponen Utama 3
Variabel Technical Support (X8), Warranty & Claims (X14), New Product (X15)
* Komponen Utama 4
Variabel E-Commerce (X7), Advertising (X10), Salesforce Image (X12), Price Flexibility (X17)
Selanjutnya berdasarkan perhitungan SPSS didapatkan pula variabel baru (komponen) yang terdiri atas empat (4) komponen yaitu sebagai berikut.
Kesimpulan
Berdasarkan pembahasan pada artikel ini, Principal Component Analysis (PCA) telah berhasil diterapkan untuk mereduksi dimensi dataset yang kompleks dan mengidentifikasi komponen utama yang mendasari variabilitas dalam data. Melalui proses PCA, beberapa komponen utama telah diidentifikasi sebagai representasi dari variabel asli yang berjumlah lebih banyak. Komponen utama pertama menunjukkan kontribusi terbesar terhadap variansi total, diikuti oleh komponen-komponen selanjutnya dengan kontribusi variansi yang semakin berkurang.
PCA memungkinkan kita untuk mereduksi data dari yang semula terdapat 13 variabel (yaitu variabel x6 sampai dengan x18) menjadi 4 komponen utama, tanpa kehilangan informasi yang signifikan. Ini sangat berguna dalam menyederhanakan analisis data dan visualisasi.
Implikasi dan Aplikasi
PCA telah membuktikan efektivitasnya dalam mengungkap struktur laten dalam dataset yang besar dan kompleks, memberikan dasar yang kuat untuk analisis lanjutan. Hasil dari PCA ini dapat digunakan untuk:
- Menyederhanakan model analisis tanpa kehilangan informasi penting.
- Mengidentifikasi pola dan hubungan yang tidak terlihat dalam analisis variabel tunggal.
- Memperbaiki interpretasi dan pengambilan keputusan berdasarkan data yang lebih ringkas dan terstruktur.
Secara keseluruhan, penerapan PCA dalam penelitian ini tidak hanya meningkatkan efisiensi analisis data tetapi juga memberikan wawasan yang lebih mendalam tentang dinamika yang mendasari data. Ke depan, hasil PCA ini dapat digunakan untuk mendukung berbagai aplikasi, mulai dari pemodelan prediktif hingga pengembangan strategi kebijakan yang lebih tepat sasaran.
Referensi
Finally, sampai sudah kita di penghujung artikel, sekian penjelasan terkait Tutorial SPSS untuk Principal Component Analysis. Apabila masih ada yang dibingungkan bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya.