SPSS

Distribusi Frekuensi – Tutorial SPSS (Studi Kasus: Distribusi Frekuensi Ukuran Ikan Tongkol Lisong)

Halo sobat Exsight, pada artikel ini kita akan belajar membuat tabel distribusi frekuensi menggunakan software SPSS. Nah, studi kasus kali ini di bidang perikanan yakni distribusi frekuensi ukuran ikan tongkol lisong (Auxis rochei), lebih tepatnya panjang total/total length (TL) ikan tongkol lisong ya. Yuk, kita simak bersama!

Pengertian

Distribusi frekuensi adalah metode untuk mengelompokkan data dan menunjukkan seberapa sering setiap nilai atau kategori muncul dalam sampel atau populasi. Distribusi frekuensi ini melakukan penyusunan data mulai dari yang terkecil sampai yang terbesar dengan membagi banyaknya data ke dalam beberapa kelas agar mudah dipahami dan dibaca. Jenis distribusi frekuensi, salah satunya distribusi frekuensi kualitatif. Skala pengukuran yang dipergunakan untuk data kualitatif adalah skala nominal dan ordinal. Untuk pengamatan kualitatif ini kita perlu mendefinisikan kategori-kateori sedemikian rupa sehingga untuk setiap pengamatan hanya akan masuk dalam satu dan hanya satu kategori. Kumpulan data lalu dideksripsikan secara numerik dengan menghitung banyaknya pengamatan atau proporsi dari total.

Data yang telah diperoleh dari suatu penelitian dan masih berupa data acak dapat dibuat menjadi data yang berkelompok, yaitu data yang telah disusun ke dalam kelas-kelas tertentu. Daftar yang memuat data berkelompok disebut distribusi frekuensi atau tabel frekuensi. Distribusi frekuensi adalah susunan data menurut kelas interval tertentu atau menurut kategori tertentu dalam sebuah daftar (Hasan, 2001).

Komponen Penyusun Distribusi Frekuensi

Distribusi frekuensi dalam statistik memiliki beberapa bagian penting yang digunakan untuk menyusun tabel atau daftar distribusi frekuensi. Setiap bagian ini memiliki peran dan fungsi yang berbeda dalam mengelompokkan data sehingga memudahkan dalam memahami pola atau tren yang muncul. Berikut ini penjelasan mengenai setiap bagian dari distribusi frekuensi secara lebih rinci:

1) Kelas-kelas (Class): Kelas adalah pengelompokan nilai-nilai data acak atau variabel menjadi beberapa kelompok. Pengelompokan ini bertujuan untuk menyederhanakan data agar lebih mudah dianalisis. Setiap kelas mewakili rentang nilai tertentu dari data, sehingga data dapat disusun dan dilihat dalam kelompok yang lebih kecil dan terorganisir.

2) Batas Kelas (Class Limits): Batas kelas adalah nilai yang menandai atau memisahkan satu kelas dengan kelas lainnya. Batas kelas ini sebenarnya bersifat semu atau tidak nyata, karena terdapat celah di antara batas kelas tersebut. Batas kelas terdiri dari dua jenis, yaitu batas kelas bawah dan batas kelas atas. Batas kelas bawah adalah nilai terendah dalam suatu kelas, sedangkan batas kelas atas adalah nilai tertinggi dalam kelas tersebut.

3) Tepi Kelas (Class Boundaries): Tepi kelas, yang juga disebut batas nyata kelas, adalah batas kelas yang tidak memiliki celah di antara kelas-kelas yang berurutan. Ini berarti antara satu kelas dan kelas yang lain tidak ada celah atau ruang kosong untuk nilai tertentu. Tepi kelas terdiri dari tepi bawah dan tepi atas, yang menunjukkan batas yang lebih tepat antara kelas-kelas yang saling berurutan, sehingga distribusi data menjadi lebih akurat.

4) Titik Tengah Kelas atau Tanda Kelas (Class Mark): Titik tengah kelas adalah nilai yang berada di tengah suatu kelas dan berfungsi sebagai wakil atau perwakilan nilai dari kelas tersebut. Titik tengah kelas dapat dihitung dengan menambahkan batas atas dan batas bawah kelas, kemudian membaginya dengan dua. Rumusnya adalah: Titik tengah kelas = ½ (batas atas + batas bawah). Dengan adanya titik tengah ini, kita bisa memperoleh gambaran mengenai posisi atau lokasi rata-rata data di dalam suatu kelas tertentu.

5) Interval Kelas (Class Interval): Interval kelas adalah jarak atau rentang nilai antara satu kelas dengan kelas lainnya. Rentang ini menunjukkan perbedaan antara nilai-nilai dalam satu kelas dibandingkan dengan kelas lain. Interval kelas berfungsi untuk mengatur seberapa lebar atau sempit sebuah kelas dalam daftar distribusi, sehingga distribusi data dapat diatur dengan lebih proporsional.

6) Panjang Interval Kelas atau Luas Kelas (Class Width): Panjang interval kelas adalah selisih atau jarak antara tepi atas dan tepi bawah suatu kelas. Panjang interval ini sering kali digunakan untuk menilai konsistensi dalam pengelompokan data, di mana setiap kelas dalam tabel distribusi memiliki panjang yang sama atau bervariasi tergantung pada jenis distribusi yang digunakan. Panjang interval ini juga mempermudah pembacaan tabel distribusi, terutama untuk data dalam jumlah besar.

7) Frekuensi Kelas (Class Frequency): Frekuensi kelas adalah jumlah data yang termasuk ke dalam kelas tertentu dalam distribusi frekuensi. Frekuensi ini menunjukkan seberapa sering nilai-nilai data berada di dalam suatu kelas tertentu. Dengan mengetahui frekuensi kelas, kita bisa melihat seberapa padat atau tersebarnya data di dalam rentang nilai tertentu. Frekuensi kelas membantu mengidentifikasi tren atau pola yang mungkin muncul dalam data.

Dengan memahami setiap bagian dari distribusi frekuensi ini, kita dapat membuat tabel distribusi frekuensi yang lebih terstruktur dan informatif. Tabel ini nantinya dapat digunakan untuk berbagai analisis statistik, seperti mencari kecenderungan data, mengevaluasi pola distribusi, dan mendapatkan wawasan yang lebih dalam mengenai data yang sedang dianalisis. Dalam membuat tabel distribusi frekuensi, penting untuk menentukan batas kelas, interval, dan panjang interval yang tepat agar data terwakili secara akurat dan mudah dipahami.

Jenis Distribusi Frekuensi

Dalam statistik, distribusi frekuensi adalah konsep yang digunakan untuk mengelompokkan data ke dalam beberapa kategori atau kelas, sehingga kita bisa memahami pola yang ada dalam kumpulan data tersebut. Distribusi frekuensi memiliki beberapa jenis yang berbeda, tergantung pada karakteristik data dan tujuan analisis. Berikut adalah tiga jenis distribusi frekuensi utama yang biasa digunakan:

1) Distribusi Frekuensi Biasa
Distribusi frekuensi biasa adalah jenis distribusi yang hanya menunjukkan jumlah atau frekuensi setiap kelompok data. Dengan distribusi ini, kita dapat melihat berapa banyak data yang termasuk dalam masing-masing kelompok atau kelas. Distribusi frekuensi biasa terbagi lagi menjadi dua jenis, yaitu distribusi frekuensi numerik dan distribusi frekuensi peristiwa (atau kategori).

  • Distribusi Frekuensi Numerik: Dalam distribusi ini, data dikelompokkan berdasarkan nilai numeriknya. Contohnya, dalam data tinggi badan siswa, kita dapat mengelompokkan siswa berdasarkan rentang tinggi tertentu, seperti 150-160 cm, 160-170 cm, dan seterusnya.
  • Distribusi Frekuensi Peristiwa atau Kategori: Berbeda dengan frekuensi numerik, jenis distribusi ini digunakan untuk data kategori atau kualitatif. Misalnya, untuk data preferensi warna, kita bisa membuat kelompok berdasarkan warna favorit, seperti merah, biru, hijau, dan kuning, lalu menghitung berapa banyak orang yang memilih setiap warna tersebut.

2) Distribusi Frekuensi Relatif
Distribusi frekuensi relatif menunjukkan perbandingan atau proporsi dari setiap kelas atau kelompok terhadap jumlah total pengamatan yang ada. Dalam distribusi ini, kita menghitung seberapa besar data dalam setiap kelas dibandingkan dengan keseluruhan data, yang diwakili dalam bentuk persentase atau pecahan. Distribusi ini diperoleh dengan cara membagi frekuensi pada setiap kelas dengan total jumlah data. Dengan distribusi frekuensi relatif, kita dapat melihat seberapa signifikan setiap kelas atau kelompok data. Misalnya, jika kita memiliki data panjang ikan dan ingin mengetahui berapa persentase ikan yang memiliki panjang antara 135-150 mm, kita dapat menggunakan distribusi frekuensi relatif untuk mendapatkannya.

3) Distribusi Frekuensi Kumulatif
Distribusi frekuensi kumulatif adalah jenis distribusi yang menunjukkan frekuensi kumulatif atau total yang dijumlahkan dari kelas pertama hingga kelas tertentu. Dalam distribusi ini, kita mengumpulkan frekuensi secara bertahap hingga mencapai kelas terakhir. Distribusi ini sangat berguna ketika kita ingin melihat seberapa banyak data yang berada di bawah atau di atas nilai tertentu dalam data kita. Distribusi frekuensi kumulatif terdiri dari dua jenis:

  • Distribusi Frekuensi Kumulatif Kurang Dari: Dalam jenis ini, kita menjumlahkan frekuensi dari kelas yang paling rendah hingga kelas tertentu, sehingga kita dapat mengetahui berapa banyak data yang kurang dari atau di bawah nilai tertentu.
  • Distribusi Frekuensi Kumulatif Lebih Dari: Sebaliknya, pada distribusi ini, kita menjumlahkan frekuensi dari kelas tertentu hingga kelas yang paling tinggi, yang menunjukkan berapa banyak data yang berada di atas atau lebih dari nilai tertentu.

Distribusi frekuensi kumulatif biasanya disajikan dalam bentuk grafik yang disebut kurva ogif. Kurva ini menggambarkan akumulasi data dari kelas ke kelas, dan membantu dalam memahami pola penyebaran data secara keseluruhan.

Dengan memahami ketiga jenis distribusi frekuensi ini—distribusi frekuensi biasa, distribusi frekuensi relatif, dan distribusi frekuensi kumulatif—kita bisa mendapatkan wawasan lebih dalam tentang data yang kita miliki. Masing-masing jenis distribusi memiliki kegunaan tersendiri, tergantung pada apa yang ingin kita lihat dari data tersebut. Distribusi frekuensi biasa cocok digunakan untuk melihat jumlah setiap kelas atau kategori, distribusi frekuensi relatif cocok untuk melihat proporsi, dan distribusi frekuensi kumulatif berguna untuk analisis akumulasi data dari kelas terendah hingga tertinggi.

Penyusunan Distribusi Frekuensi

Untuk menyusun distribusi frekuensi dalam analisis statistik, ada beberapa langkah penting yang harus diikuti, dimulai dengan mengurutkan data dari nilai terkecil hingga terbesar. Setelah data diurutkan, langkah-langkah berikut ini akan membantu dalam menyusun distribusi frekuensi secara sistematis:

1) Menentukan Jangkauan (Range)
Langkah pertama setelah mengurutkan data adalah menghitung jangkauan, yang merupakan selisih antara nilai data terbesar dan terkecil. Jangkauan membantu dalam menentukan seberapa luas rentang data yang ada, yang nantinya akan digunakan untuk mengatur kelas-kelas dalam distribusi. Rumusnya adalah:

\text{Jangkauan} = \text{Data Terbesar} - \text{Data Terkecil}

2) Menentukan Jumlah Kelas (k)
Menentukan jumlah kelas adalah tahap penting dalam distribusi frekuensi. Untuk jumlah kelas, kita bisa menggunakan rumus Sturgess:

k = 1 + 3.3 \log(n)

Di sini, k adalah banyaknya kelas yang akan digunakan, dan n adalah total data. Rumus ini membantu memastikan bahwa jumlah kelas yang dipilih sesuai dengan ukuran data yang dimiliki, sehingga distribusi frekuensi dapat terbaca dengan baik.

3) Menentukan Panjang Interval Kelas
Panjang interval kelas adalah jarak yang memisahkan setiap kelas dalam distribusi. Interval ini akan membantu mempermudah pembagian data dalam setiap kelas. Rumusnya adalah:

i = \frac{\text{Jangkauan (R)}}{\text{Jumlah Kelas (k)}}

Interval kelas yang tepat membuat data lebih mudah dianalisis dan membantu menghindari kelas yang terlalu lebar atau terlalu sempit.

4) Menentukan Batas Bawah Kelas Pertama
Menentukan batas bawah kelas pertama adalah langkah penting dalam distribusi frekuensi. Batas bawah ini biasanya dimulai dari data terkecil atau bisa juga menggunakan nilai sedikit lebih rendah dari data terkecil, tergantung pada rentang data. Selisih antara batas bawah kelas pertama dan data terkecil biasanya kurang dari panjang interval kelas yang ditentukan sebelumnya. Batas ini akan menjadi acuan untuk menentukan batas kelas berikutnya.

5) Mengisi Frekuensi Kelas dalam Kolom Tally atau Turus
Langkah terakhir dalam menyusun distribusi frekuensi adalah mencatat frekuensi kelas ke dalam kolom turus atau tally. Kolom tally berfungsi sebagai catatan visual dari jumlah data yang ada pada setiap kelas. Dalam sistem tally, kita cukup mencoret satu garis untuk setiap data yang berada dalam kelas tertentu. Setelah seluruh data dicatat dalam kelas masing-masing, kita bisa mengetahui berapa banyak data yang berada pada setiap interval, sehingga kita mendapatkan distribusi frekuensi lengkap.

Dengan mengikuti langkah-langkah ini, distribusi frekuensi dapat disusun dengan lebih rapi dan memudahkan analisis data lebih lanjut. Distribusi frekuensi yang baik membantu dalam visualisasi pola data serta mempermudah perbandingan antar kelas atau kategori dalam data yang sedang dianalisis.

Tutorial SPSS – Distribusi Frekuensi Panjang Tongkol Lisong (Auxis rochei)

Ikan tongkol lisong (Auxis rochei) adalah salah satu jenis ikan pelagis besar yang tergolong dalam kelompok sheerfish dan tuna neritik. Ikan ini termasuk dalam famili Scombridae dan hidup di zona epipelagik hingga mesopelagik, yaitu daerah laut yang mencakup kedalaman dangkal hingga menengah. Penyebaran ikan tongkol lisong sangat dipengaruhi oleh suhu perairan, sehingga keberadaannya dapat bervariasi sesuai dengan perubahan suhu laut di berbagai wilayah.

Setiap tahun, ikan tongkol lisong menjadi salah satu target utama penangkapan karena memiliki nilai ekonomi yang tinggi dan permintaan yang terus meningkat. Ikan ini ditangkap dengan berbagai alat tangkap yang sesuai, seperti purse seine atau jaring lingkar dan alat pancing lainnya. Alat-alat tangkap ini dipilih karena mampu menangkap ikan pelagis dalam jumlah besar, terutama ketika ikan ini membentuk kumpulan di wilayah tertentu.

Penyebaran ikan tongkol lisong cukup luas di perairan tropis dan subtropis. Di Indonesia, ikan ini ditemukan di berbagai wilayah seperti perairan barat Sumatra, Samudra Hindia, Selat Makassar, perairan sekitar Nusa Penida Bali, dan Teluk Bone. Khusus di Selat Makassar, area ini menjadi salah satu lokasi utama penangkapan ikan tongkol lisong. Wilayah lain yang menjadi pusat pendaratan ikan tongkol lisong adalah Pangkalan Pendaratan Ikan (PPI) Labuan Bajo di Sulawesi Tengah, yang merupakan area penting untuk industri perikanan pelagis.

Adaptasi ikan tongkol lisong terhadap suhu air yang bervariasi memungkinkan ikan ini menyebar secara luas di berbagai jenis perairan, baik di lautan lepas maupun di wilayah perairan dekat pesisir. Mereka memiliki kemampuan untuk bermigrasi mengikuti arus laut dan perubahan suhu, yang memudahkan mereka beradaptasi dengan kondisi lingkungan yang berbeda. Inilah sebabnya ikan tongkol lisong dapat ditemukan di berbagai wilayah tropis dan subtropis, mulai dari samudra terbuka hingga teluk dan selat yang dekat dengan pesisir.

Okey teman-teman semua, mari kita coba untuk membuat tabel distribusi frekuensi panjang ikan ya. Pada tutorial kali ini data yang dipakai yakni sampel panjang ikan tongkol lisong (Auxis rochei) yang berjumlah 74 sampel. Panjang ikan tersebut diukur panjang total nya atau total length (TL) dalam unit mili meter (mm). Teman-teman juga bisa download data panjang ikan di link ini ya untuk belajar bersama “Data Panjang Ikan Tongkol Lisong”. Pada link data tersebut, hanya data panjang ikan saja yang dapat dibagikan. Variabel lain dari data ini (berat ikan) tidak dapat dibagikan karena merupakan bagian dari data riset.

Tutorial SPSS

  • Siapkan data yang akan disusun menjadi tabel distribusi frekuensi panjang ikan. Jumlah data yang dikumpulkan dalam penelitian N = 74 sampel ikan tongkol lisong
  • Pada Variable View kita inputkan Panjang dan Berat pada kolom Name
  • Pada Label bisa kita tuliskan seperti di contoh, sesuai dengan kebutuhan data penelitian
  • Copy data dari excel kemudian paste pada SPSS di Data View
  • Pilih Analyze -> Descriptive Statistics -> Frequencies
  • Pindahkan variabel dari kotak kiri ke kotak kanan menggunakan tombol panah tersebut. Jangan lupa centang pada Display frequency tables, kemudian klik OK
  • Hitung nilai range (R), jumlah/banyak kelas (K), dan panjang kelas (P)
  • Susun intervaslnya sesuai dengan hasil perhitungan tersebut, seperti panduan di excel bawah ini
  • Transform data panjang untuk mendapatkan data frekuensi pada masing-masing kelas data
  • Klik Transform -> Recode into Different Variables
  • Masukkan variabel panjang, output variable kita ganti pada nama dan labelnya
  • Klik old and new values
  • Masukkan data panjang dan interval kelasnya
  • Pada Variable View, kita edit value sesuai dengan data panjang dan kelas
  • Kita analisis frekuensi lagi, kali ini data tersusun dari jumlah dan panjang kelas
  • Klik Analyze -> Descriptive Statistics -> Frequencies
  • Masukkan data transform interval kelasnya seperti di bawah ini
  • Berikut output yang dihasilkan yaitu tabel distribusi frekuensi panjang ikan tongkol
  • Dapat disimpulkan bahwa jumlah keseluruhan sampel ikan tongkol yakni 74 data dimana terdiri dari 7 kelas. Setiap kelas memiliki data frekuensi, persentase, keakuratan persentase, dan persentase kumulatif.
  • Misal pada baris pertama, terdapat 14 sampel dengan panjang 17.20 mm – 17.80 mm. Adapun 14 sampel ini merupakan 18.9% dari total keseluruhan sampel.
  • Pada baris kedua, terdapat 42 sampel dengan panjang 17.90 mm – 18.50 mm. Adapun 42 sampel ini merupakan 56.8% dari total keseluruhan sampel. Jika dijumlahkan dengan kelas sebelumnya, maka terdapat 75.7% sampel pada kelas 17.20 mm – 17.80 mm dan 17.90 mm – 18.50 mm.

Referensi

Hasanah, N., Putra, A. E., Nurdin, M. S., dan Maasily, I. S. 2022. Pertumbuhan Ikan Tongkol Lisong (Auxis rochei) di Selat Makassar Sulawesi Tengah. Prosiding Semnas Politani Pangkep. Vol 3.
Wahyuning, S. 2021. Dasar-Dasar Statistik. Yayasan Prima Agung: Semarang.

Sekian penjelasan artikel kali ini. Apabila masih ada yang dibingungkan bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya. Bye bye!

Distribusi Frekuensi – Tutorial SPSS (Studi Kasus: Distribusi Frekuensi Ukuran Ikan Tongkol Lisong) Read More »

Chi-Square Test: Tutorial SPSS

Hai hai sobat Exsight. Kembali lagi dalam artikel Exsight. By the way, sobat Exsight masih ingat gak nih, pada beberapa artikel yang lalu pernah disinggung terkait topik Penjelasan dan Langkah Mudah Uji Chi Square di RStudio. Nah melanjutkan dari artikel sebelumnya, kali ini kita akan membahas lebih mendalam terkait Tutorial Chi-Square yakni dengan software SPSS. Tanpa berlama-lama lagi, yuk yuk simak artikel ini dengan seksama!

Deskripsi

Uji Chi-Square dapat digunakan untuk mengetahui ada tidaknya korelasi antar dua variabel khususnya pada data berskala nominal. Langkah uji chi square adalah dengan membuat tabulasi silang suatu variabel berdasarkan kategorinya dan dilanjutkan dengan melakukan uji hipotesis untuk menguji apakah frekuensi yang diamati berbeda dari frekuensi yang diharapkan. Jika diperoleh keputusan bahwa terdapat perbedaan antara frekuensi yang diamati dengan frekuensi yang diharapkan, maka dapat disimpulkan bahwa kedua variabel memiliki korelasi.

Hipotesis pada uji Chi-Square yaitu sebagai berikut.
H0 : Tidak terdapat hubungan yang signifikan antara dua variabel
H1 : Terdapat hubungan yang signifikan antara dua variabel

Uji Chi-square dapat dirumuskan sebagai berikut:

di mana
X^{2} = Distribusi Chi-square
Oi = Nilai observasi (pengamatan) ke-i
Ei = Nilai ekspektasi ke-i = \frac{\left ( Total Baris \right )\left ( Total Kolom \right )}{Total Keseluruhan}

Konsep Dasar Chi-Square Test

Konsep dasar yang digunakan untuk chi-square test adalah data berasal dari sampel acak dan dapat disajikan dalam tabel dua arah.

* Data Dapat Disajikan dalam Tabel Dua Arah
Uji chi-square biasanya digunakan untuk menguji hubungan antara dua variabel kategori. Data ini harus bisa disusun dalam tabel kontingensi dua arah, di mana satu variabel ditampilkan sebagai baris dan variabel lainnya sebagai kolom.
Contoh:
Misalkan kita memiliki data tentang preferensi minuman (teh atau kopi) berdasarkan jenis kelamin (pria atau wanita). Data ini dapat disusun dalam tabel dua arah dengan baris untuk jenis kelamin dan kolom untuk preferensi minuman.

Pentingya Chi-Square Test

Mengapa Chi-Square Test Penting dalam Analisis Data?

*Validasi Hubungan Antar Variabel
Uji chi-square membantu dalam menentukan apakah ada hubungan yang signifikan antara dua variabel kategori. Hal ini penting untuk memahami dinamika antar variabel dalam berbagai konteks penelitian.

*Mengidentifikasi Perbedaan
Dalam analisis data, chi-square test digunakan untuk mengidentifikasi perbedaan dalam distribusi frekuensi antar kelompok, yang bisa sangat berguna dalam bidang seperti pemasaran, psikologi, dan ilmu sosial lainnya.

Tahapan Chi-Square Test

Langkah – langkah dalam pengujian Chi-square yaitu sebagai berikut.

  1. Merumuskan hipotesis H0 dan hipotesis H1
  2. Menetapkan alpha atau taraf signifikansi (umumnya menggunakan alpha 5%)
  3. Menghitung statistik uji
  4. Melakukan pengujian dan interpretasi hasil

Rumus pada uji Chi–square sebenarnya tidak hanya ada satu. Apabila pada tabel kontingensi 2 X 2 maka rumus yang digunakan adalah Continuty Correction. Apabila tabel kontingensi 2 X 2, tetapi tidak memenuhi syarat dalam uji Chi-square maka rumus yang digunakan adalah Fisher Exact Test. Sedangkan apabila tabel kontingensi lebih dari 2 X 2 misal 2 X 3 maka rumus yang digunakan adalah Pearson Chi-square.

Kelebihan dan Kelemahan

Terdapat beberapa kelebihan dan kelemahan pada uji chi-square diantaranya adalah sebagai berikut.

Kelebihan

  1. Sederhana dan Mudah Dipahami
    Uji chi-square menggunakan formula yang relatif sederhana, sehingga mudah dipahami bahkan oleh mereka yang baru mempelajari statistik.
  2. Analisis Data Kategorikal
    Uji ini sangat cocok untuk menganalisis data kategorikal, contoh data kategorikal diantaranya seperti jenis kelamin, warna favorit, atau status pernikahan.
  3. Tidak Membutuhkan Asumsi Distribusi Normal
    Berbeda dengan banyak uji statistik lainnya, uji chi-square tidak memerlukan asumsi bahwa data harus berdistribusi normal.
  4. Fleksibelitas
    Dapat digunakan untuk berbagai macam analisis, termasuk uji kecocokan (goodness of fit), uji kemandirian (test of ndependence), dan uji homogenitas.
  5. Apliksi Penerapan Luas
    Uji chi-square digunakan dalam berbagai bidang seperti biologi, kedokteran, ilmu sosial, pemasaran, dan lainnya untuk menguji hipotesis tentang distribusi frekuensi.

Kelemahan

  1. Sensitivitas terhadap Ukuran Sampel
    Uji chi-square sangat sensitif terhadap ukuran sampel. Ukuran sampel yang terlalu kecil dapat menghasilkan hasil yang tidak dapat diandalkan, sementara ukuran sampel yang sangat besar dapat menyebabkan uji menjadi terlalu sensitif dan mendeteksi perbedaan yang tidak bermakna secara praktis.
  2. Tidak Dapat Digunakan untuk Data Kontinu
    Uji Chi- Square hanya dapat digunakan untuk data kategorikal. Untuk data kontinu, data harus diubah menjadi kategori, yang dapat menyebabkan hilangnya informasi.
  3. Frekuensi Harapan
    Untuk hasil yang dapat diandalkan, uji chi-square menyaratkan bahwa frekuensi harapan dalam setiap sel tabel kontingensi tidak boleh terlalu kecil (idealnya tidak kurang dari 5). Ini dapat menjadi kendala dalam analisis data dengan banyak kategori atau sampel yang kecil.
  4. Keterbatasan dalam Analisis Multivariat
    Uji chi-square terbatas pada analisis dua variabel (univariat atau bivariat) dan tidak cocok untuk analisis multivariat yang melibatkan lebih dari dua variabel tanpa modifikasi atau penggunaan metode statistik tambahan.
  5. Keterbatasan Interpretasi
    Meskipun uji chi-square dapat menunjukkan adanya asosiasi antara variabel-variabel kategorikal, uji ini tidak memberikan informasi tentang kekuatan atau arah hubungan tersebut.

Tutorial SPSS Uji Chi-Square

Studi Kasus

Studi kasus pada artikel kali ini akan menggunakan data yang serupa dengan data pada artikel sebelumnya yakni pada artikel pengujian Chi-Square dengan R Studio. Dalam hal ini data yang digunakan merupakan data keterlibatan warga baik laki-laki dan perempuan pada kegiatan kerja bakti di suatu wilayah. Selengkapnya data bisa diakses disini.

Chi-Square

Dataset terdiri atas 99 data, dimana terdiri atas 2 variabel yaitu: Variabel Jenis Kelamin dan Variabel Kerja Bakti. Kedua variabel tersebut merupakan variabel kategorik yang bersifat nominal. Adapun untuk Variabel Jenis Kelamin terdiri atas 2 kategori (Laki-laki dan Perempuan), sedangkan Variabel Kerja Bakti juga terdiri atas 2 kategori (Terlibat dan Tidak)

  1. .Buka software SPSS, kemudian entry data pada variable view dan data view.
Chi-Square
Gambar 1. SPSS Tahap 1a

Pada bagian data view berisi data-data dari masing-masing variabel, sedangkan untuk bagian variable view berisi pendefinisian dari masing-masing (khususnya terkait jenis data pada bagian measure).

Chi-Square
Gambar 2. SPSS Tahap 1b

3. Tahapan berikutnya klik Analyze lalu klik Descriptive Statistics, kemudian klik Crosstabs

Chi-Square
Gambar 3. SPSS Tahap 2

4.Selanjutnya akan muncul tampilan dialog box seperti halnya pada Gambar 4., dalam hal ini untuk bagian Row(s) kita isi dengan variabel Jenis_Kelamin, lalu untuk bagian Column(s) diisi dengan variabel Kerja_Bakti. Kemudian, tak lupa, kita juga perlu klik pada bagian Statistics.

Chi-Square
Gambar 4. SPSS Tahap 3

5. Apabila kita klik pada bagian Statistics , nantinya akan muncul tampilan seperti pada Gambar 5. Dalam hal ini, kita centang pada bagian Chi- Square, lalu kita klik Continue.

Chi-Square

Gambar 5.
SPSS Tahap 4

6. Setelah itu nantinya akan muncul kembali tampilan SPSS seperti halnya pada Gambar 4. Dalam hal ini sekarang kita klik tombol Cells, seperti yang terlihat pada Gambar 6.

Chi-Square
Gambar 6. SPSS Tahap 5

7. Nantinya akan muncul tampilan seperti Gambar 7. Kemudian pada display Crosstabs: Cell Display, dalam hal ini pada bagian Counts, kita centang pada bagian Observed dan bagian Expected. Lalu kita klik Continue.

Chi-Square
Gambar 7. SPSS Tahap 6

Pembahasan Hasil Output SPSS

Setelah klik OK, maka didapatkan hasil output SPSS sebagai berikut.

Chi-Square
Gambar 8. Hasil Output SPSS (1)

Berdasarkan hasil output SPSS pada Gambar 8. diketahui bahwa terdapat 99 data dimana seluruhnya diproses dalam analisis. Artinya tidak ada missing value atau data yang hilang sehingga tingkat kevalidan penggunaan data dalam pada proses chi-square valid 100%.

Chi-Square

Gambar 9.
Hasil Output SPSS (2)

Selanjutnya didapatkan pula hasil output SPSS seperti yang terlampir pada Gambat 9. , dalam hal ini output di atas menampilkan tabel tabulasi silang yang menunjukkan hubungan antara variabel Jenis Kelamin dan variabel Kerja Bakti. Interpretasi dari output pada Gambar 9 di atas yaitu:

  • Dari 99 data, secara keseluruhan terdapat data laki- laki yaitu sebanyak 47 orang dan perempuan sebanyak 52 orang. Adapun apabila ditinjau berdasarkan keterlibatan dalam kegiatan kerja bakti, diketahui bahwa terdapat 59 orang yang terlbat dan 40 lainnya tidak demikian.
  • Nilai 41 pada baris pertama kolom pertama menunjukkan bahwa terdapat 41 orang laki-laki yang terlibat dalam kegiatan kerja bakti. Sedangkan 6 orang laki-laki lainnya tidak terlibat dalam kerja bakti ditunjukkan pada baris pertama kolom kedua.
  • Nilai 18 pada baris ketiga kolom pertama menunjukkan bahwa terdapat 18 orang perempuan yang terlibat dalam kegiatan kerja bakti. Sedangkan 34 orang perempuan lainnya tidak terlibat dalam kerja bakti ditunjukkan pada baris ketiga kolom kedua.
Chi-Square
Gambar 10. Hasil Output SPSS (3)

Di awal artikel khususnya pada bagian deskripsi, telah disebutkan terkait hipotesis untuk pengujian chi-square. Namun dalam hal ini, penulisan hipotesis perlu dilakukan penyesuaian, sesuai data yang kita gunakan, di mana melibatkan variabel Jenis Kelamin dan variabel Kerja Bakti. Hipotesis dapat dituliskan sebagai berikut.

H0 : Tidak terdapat hubungan yang signifikan antara variabel Jenis Kelamin dan variabel Kerja Bakti.
H1 : Terdapat hubungan yang signifikan antara variabel Jenis Kelamin dan variabel Kerja Bakti.

Berdasal output SPSS pada Gambar 10. untuk interpretasil hasil pengujian chi- square, kita fokuskan pada nilai-nilai yang terdapat pada baris yang sama dengan baris “Continuity Correction” karena tabel kontingensi yang diuji merupakan tabel 2×2 dan tidak ada sel dengan nilai eskpektasi kurang dari 5. Dalam hal ini kita perhatikan nilai Asymptotic Significance (2- sided) atau yang biasa disebut dengan p-value, dimana nilainya sebesar 0.000. Namun, jika pada tabel 2×2 terdapat sel dengan nilai eskpektasi kurang dari 5, maka gunakan p-value pada baris “Fisher’s Exact Test“.

Apabila pada pengujian ini, kita menggunakan taraf signifikansi (alpha) sebesar 5% atau 0.05, maka didapatkan nilai Asymptotic Significance (2- sided) lebih kecil daripada p-value yakni 0.000 < 0.05. Sehingga dapat diambil keputusan bahwa Tolak H0, artinya terdapat hubungan yang signifikan antara variabel Jenis Kelamin dan variabel Kerja Bakti.

Referensi

Dewanti, D. (2023). Metode Statistika Populer untuk Penelitian. Bogor: Exsight.

https://www.spssindonesia.com/2015/01/uji-chi-square-dengan-spss-lengkap.html

Negara, I. (2018). Penggunaan Uji Chi-Square untuk Mengetahui Pengaruh Tingkat Pendidikan dan Umur Terhadap Pengetahuan PENASUN Mengenai HIV-AIDS di Provinsi DKI Jakarta. Prosiding Seminar Nasional Matematika dan Terapannya.

Sekian penjelasan terkait Tutorial Chi-Square dengsn SPSS. Jika masih ada yang dibingungkan bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya.

Chi-Square Test: Tutorial SPSS Read More »

Principal Component Analysis: Tutorial SPSS (Part 2)

Principal Component Analysis — Bayangkan sobat Exsight sedang mengunjungi sebuah perpustakaan raksasa dengan ribuan buku yang tersebar di berbagai rak. Setiap buku berisi informasi penting, namun untuk menemukan buku yang tepat di antara sekian banyak pilihan bisa menjadi tantangan yang sulit. Kemudian, bayangkan ada seorang pustakawan cerdas yang mampu menyusun ulang perpustakaan tersebut sehingga hanya dengan beberapa panduan sederhana, sobat Exsight bisa menemukan semua informasi yang Anda butuhkan dengan mudah. Dalam dunia analisis statistik, pustakawan cerdas ini dikenal sebagai Principal Component Analysis (PCA).

Principal Component Analysis (PCA) adalah teknik statistik yang digunakan untuk menyederhanakan kompleksitas data. PCA membantu kita menemukan pola-pola penting dalam dataset yang besar dan rumit, dengan cara mengurangi jumlah dimensi tanpa menghilangkan informasi yang berharga. Jadi, alih-alih bekerja dengan ratusan variabel yang membingungkan, PCA memungkinkan kita untuk fokus hanya pada beberapa “komponen utama” yang mewakili sebagian besar variasi dalam data.

Pada beberapa artikel Exsight yang sebelumnya, pernah disinggung terkait topik ini yaitu pada artikel dengan judul PCA (Principal Component Analysis). Nah, melanjutkan dari artikel yang lalu, sekarang kita akan fokus pada penerapan Principal Component Analysis melalui tutorial dengan software SPSS. Tanpa berlama-lama lagi, yuk simak artikel ini, dengan seksama yaa!

Definisi

Principal Component Analysis (PCA) seringkali disebut juga sebagai analisis komponen utama merupakan suatu metode statistik yang digunakan untuk mengurangi dimensi dari kumpulan data yang kompleks, yang saling berkorelasi satu sama lain, sehingga menjadi variabel baru (disebut dengan komponen utama) yang berukuran lebih kecil, namun mampu menerangkan sebagian besar keragaman total data, dan saling bebas satu sama lain

Adanya PCA memungkinkan data yang semula memiliki banyak dimensi (dimensi tinggi) untuk direpresentasikan dalam dimensi yang lebih rendah, sehingga memudahkan pemahaman dan analisis data.

Tutorial SPSS Principal Component Analysis

Studi Kasus

Studi kasus pada artikel kali ini akan menggunakan data yang merupakan data sekunder yang diperoleh dari situs website www.mvstats.com. Dataset HBAT terdiri atas 23 gabungan variabel kategorik dan kontinyu. Namun dalam pembahasan ini dilakukan hanya pada variabel kontinyu mulai variabel X6 hingga variabel X18 dimana masing-masing variabel terdiri atas 100 data. Dalam hal ini data bisa diakses disini.

Principal Component Analysis
SimbolVariabel
X6Product Quality
X7E-Commerce
X8Technical Support
X9Complaint Resolution
X10Advertising
X11Product Line
X12Salesforce Image
X13Competitive Pricing
X14Warranty & Claims
X15Packaging
X16Order & Biling
X17Pricing Flexibility
X18Delivery Speed

1. Buka software SPSS, kemudian entry data pada variable view dan data view. 

Principal Component Analysis
Gambar 1a. SPSS Tahap 1 (Data View)

Pada bagian data view berisi data-data dari masing-masing variabel, sedangkan untuk bagian variable view berisi pendefinisian dari masing-masing (khususnya terkait jenis data pada bagian measure).

Principal Component Analysis
Gambar 1b. SPSS Tahap 1 (Variable View)

2. Tahapan SPSS yang perlu kita lakukan berikutnya yaitu klik Analyze, lalu kita klik Dimension Reduction, kemudian klik Factor. Selengkapnya bisa dilihat pada Gambar 2.

Principal Component Analysis
Gambar 2. SPSS Tahap 2

4. Selanjutnya akan muncul tampilan dialog box seperti halnya pada Gambar 3., dalam hal ini untuk bagian Variables kita isi dengan variabel X6 sampai dengan X18 . Jangan lupa, kita juga perlu klik pada bagian Extraction.

Principal Component Analysis
Gambar 3. SPSS Tahap 3

4. Apabila kita klik pada bagian Extraction, nantinya akan muncul tampilan seperti pada Gambar 4. Dalam hal ini, untuk bagian Method kita pilih bagian Principal Components, lalu untuk bagian Analyze kita pilih Correlation Model, serta untuk bagian Display kita beri tanda centang pada bagian Unrotated Factor Solution dan Scree Plot. Kemudian kita klik pada bagian Continue

Principal Component Analysis
Gambar 4. SPSS Tahap 4

5. Kemudian nantinya akan ditampilkan kembali tampilan seperti pada Gambar 3. Dalam hal ini, sekarang kita klik pada bagian Scores. Nantinya akan muncul tampilan seperti pada Gambar 5, yaitu (Factor Analysis: Factor Scores)

Pada Gambar 5. kita centang pada bagian Save as variables, Display factor score coefficient matrix, dan kita pilih pada bagian Regression. Lalu kita klik pada tombol Continue. Selanjutnya kita klik OK.

Principal Component Analysis
Gambar 5. SPSS Tahap 5

Pembahasan Hasil Output SPSS

Setelah klik OK, maka didapatkan hasil output SPSS sebagai berikut.

Principal Component Analysis
Gambar 6. Hasil Output SPSS (1)

Berdasarkan hasil output SPSS pada Gambar 6 di atas terkait Total Variance Explained, didapatkan hasil varians initial eigenvalues menunjukkan jumlah variabel (yaitu 3,835 + 2,675 + 1,722 + 1,544 + 0,969 + 0,575 + 0,489 + 0,421 + 0,288 + 0,190 + 0,155 + 0,128 + 0,009 = 13 variabel).

Sedangkan pada bagian Extractions Sums of Squared Loadings menunjukkan jumlah variasi atau banyaknya faktor yang dapat dibentuk, Adapun bisa dilihat pada output terdapat empat variasi faktor yaitu 3,835 ; 2,675 ; 1,722 dan 1,544.

Berdasarkan hal tersebut maka 4 komponen yang dapat terbentuk dari 13 variabel yang dianalisis di mana nilai eigen value nya masing-masing lebih besar dari 1. Component 1 menjadi komponen yang mampu menjelaskan 29,503% variasi, component 2 mampu menjelaskan 20,577% variasi, lalu component 3 mampu menjelaskan 13,243% serta component 4 mampu menjelaskan variasi sebesar 11,876%.

Secara lebih lanjut, untuk penentuan jumlah komponen dalam Principal Component Analysis dapat ditampilkan secara visual melalui tampilan scree plot. Scree plot adalah grafik yang digunakan dalam Principal Component Analysis untuk membantu menentukan berapa banyak komponen utama yang harus dipertahankan dalam analisis. Scree plot sangat berguna dalam pengambilan keputusan terkait reduksi dimensi data. Grafik scree plot ditampilkan sebagai berikut.

Principal Component Analysis
Gambar 7. Hasil Output SPSS (2)

Apabila kita perhatikan pada Gambar 7, terlihat bahwa grafik scree plot dapat dilihat untuk component number 1 , component number 2, lalu component number 3 dan component number 4 memiliki eigenvalue bernilai lebih dari 1. Sehingga dapat diartikan bahwa terdapat 4 komponen utama yang dapat dibentuk.

Visualisasi komponen-komponen utama melalui scree plot membantu dalam memahami struktur data secara intuitif, menunjukkan bagaimana observasi berkelompok berdasarkan skor komponen mereka.

Principal Component Analysis
Gambar 8. Hasil Output SPSS (3)

Selain itu terdapat hasil output SPSS lainnya yaitu terkait Communalities seperti yang terdapat pada Gambar 8. Nilai extraction untuk sebagian besar variabel (kecuali variabel X15 – New Products) bernilai lebih besar dari 0,5 , hal ini dapat diartikan bahwa sebagian besar variabel penelitian dapat digunakan untuk menjelaskan komponen- komponen yang terbentuk.

Principal Component Analysis
Gambar 9. Hasil Output SPSS (4)

Selanjunya perhitungan pada software SPSS ( Gambar 9.) menampilkan hasil output Component Matrix. Dalam hal ini, output Component Matrix di atas didapatkan berdasarkan principal components extraction method, di mana menunjukkan seberapa besar sebuah variabel berkorelasi dengan komponen utama yang akan dibentuk.

Principal Component Analysis
Gambar 10. Hasil Output SPSS (5)

Berdasarkan output SPSS didapatkan pula Component Score Coefficient Matrix seperti yang ditampilkan pada Gambar 10. Component Score Coefficient Matrix menyediakan koefisien yang digunakan untuk menghitung skor komponen untuk setiap observasi atau kasus dalam dataset. Matriks ini berisi bobot yang digunakan dalam persamaan linier untuk membentuk skor komponen.

Dalam hal ini Component Score Coefficient Matrix digunakan untuk menghitung nilai atau skor komponen utama untuk setiap observasi dalam dataset. Selain itu dapat digunakan dalam menghasilkan skor komponen yang dapat digunakan sebagai variabel baru dalam analisis selanjutnya.

* Komponen Utama 1
Variabel Complaint Resolution (X9), Order & Billing (X16), Delivery Speed (X18) memiliki korelasi yang lebih tinggi terhadap komponen 1.

* Komponen Utama 2
Variabel Product Quality (X6), Product Line (X11), Competitive Pricing (X13) berkorelasi lebih tinggi terhadap komponen 2.

* Komponen Utama 3
Variabel Technical Support (X8), Warranty & Claims (X14), New Product (X15)

* Komponen Utama 4
Variabel E-Commerce (X7), Advertising (X10), Salesforce Image (X12), Price Flexibility (X17)

Selanjutnya berdasarkan perhitungan SPSS didapatkan pula variabel baru (komponen) yang terdiri atas empat (4) komponen yaitu sebagai berikut.

Principal Component Analyst
Gambar 11. Hasil Output SPSS (6)

Kesimpulan

Berdasarkan pembahasan pada artikel ini, Principal Component Analysis (PCA) telah berhasil diterapkan untuk mereduksi dimensi dataset yang kompleks dan mengidentifikasi komponen utama yang mendasari variabilitas dalam data. Melalui proses PCA, beberapa komponen utama telah diidentifikasi sebagai representasi dari variabel asli yang berjumlah lebih banyak. Komponen utama pertama menunjukkan kontribusi terbesar terhadap variansi total, diikuti oleh komponen-komponen selanjutnya dengan kontribusi variansi yang semakin berkurang.

PCA memungkinkan kita untuk mereduksi data dari yang semula terdapat 13 variabel (yaitu variabel x6 sampai dengan x18) menjadi 4 komponen utama, tanpa kehilangan informasi yang signifikan. Ini sangat berguna dalam menyederhanakan analisis data dan visualisasi.

Implikasi dan Aplikasi

PCA telah membuktikan efektivitasnya dalam mengungkap struktur laten dalam dataset yang besar dan kompleks, memberikan dasar yang kuat untuk analisis lanjutan. Hasil dari PCA ini dapat digunakan untuk:

  • Menyederhanakan model analisis tanpa kehilangan informasi penting.
  • Mengidentifikasi pola dan hubungan yang tidak terlihat dalam analisis variabel tunggal.
  • Memperbaiki interpretasi dan pengambilan keputusan berdasarkan data yang lebih ringkas dan terstruktur.

Secara keseluruhan, penerapan PCA dalam penelitian ini tidak hanya meningkatkan efisiensi analisis data tetapi juga memberikan wawasan yang lebih mendalam tentang dinamika yang mendasari data. Ke depan, hasil PCA ini dapat digunakan untuk mendukung berbagai aplikasi, mulai dari pemodelan prediktif hingga pengembangan strategi kebijakan yang lebih tepat sasaran.

Referensi

Johnson, R., & Wichern, D. (2002). Applied Multivariate Statistical Analysis. Pearson Education, Inc.

A’laa, R., & Sutikno. (2018). Pemodelan Faktor- Faktor yang Memengaruhi Gini Rasio Pembangunan di Jawa Timur dengan Regresi Spasial. Jurnal Sains dan Seni ITS.

Finally, sampai sudah kita di penghujung artikel, sekian penjelasan terkait Tutorial SPSS untuk Principal Component Analysis. Apabila masih ada yang dibingungkan bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya.

Principal Component Analysis: Tutorial SPSS (Part 2) Read More »

Hubungi Admin
Halo, selamat datang di Exsight! 👋

Hari ini kita ada DISKON 20% untuk semua transaksi. Klaim sekarang!