Farisiyah Fitriani

Uji Validitas dan Reliabilitas pada Data Kuesioner Penelitian

Hai sobat exsight! Buat kamu yang sedng melakukan penelitian data primer, pastinya menggunakan media kuesioner untuk pengambilan datanya kan? Nah tau ngga si kalau sebenarnya menyusun kuesioner itu ada kaidah atau uji yang perlu dilakukan terlebih dahulu loh agar data yang kita dapatkan sesuai dengan apa yang kita inginkan. Emang fungsinya buat apa si? Untuk detailnya, yuk simak penjelasan berikut agar kamu lebih paham lagi 😊

Uji validitas dan reliabilitas kuesioner digunakan untuk mengetahui apakah suatu kuesioner dapat dikatakan baik untuk menilai sesuatu hal yang akan diteliti. Uji validitas mengacu pada apakah kuesioner benar-benar dapat mengukur sesuatu apa yang ingin kita ukur. Sedangkan  uji reliabilitas mengacu pada apakah kuesioner dapat memberikan hasil yang konsisten apabila dilakukan pengukuran secara berulang kali. Kuncinya adalah validitas digunakan untuk mengukur ketepatan sedangkan reliabilitas mengukur kekonsistenan. Biasanya uji ini dilakukan sebelum kuesioner di sebar ke seluruh responden penelitian kamu loh.

Kuesioner yang tidak valid dan reliabel akan menghasilkan data yang tidak akurat mengenai hal yang sedang kita ukur atau teliti sehingga informasi yang dihasilkan tidak tepat sebagai dasar pengambilan suatu keputusan. Data yang reliabel tapi tidak valid pun bisa di artikan seperti memberikan informasi yang salah secara berulang-ulang, sama seperti data yang tidak reliabel tapi valid maka informasinya tidak berguna. Skema data valid dan reliabel disajikan seperti gambar di bawah ini:

Validitas dan Reliabilitas
Skema data valid dan reliabel (Sumber: https://pubmed.ncbi.nlm.nih.gov/9110015/)

UJI VALIDITAS

Uji validitas didefinisikan sebagai sejauh mana suatu konsep akurat untuk diukur. Uji ini dapat diukur dari nilai koefisien korelasi antar skor butir dengan skor total instrumen. Apabila nilai koefisien korelasi yang dihasilkan tinggi maka semakin valid butir pertanyaan tersebut. Untuk menghitung koefisien korelasi antara skor butir dengan skor total instrumen digunakan 2 cara, yaitu dengan menggunakan korelasi pearson dan korelasi spearman. Perbedaannya terletak pada distribusi datanya, apabila data berdistribusi normal maka menggunakan korelasi pearson dan apabila data tidak berdistribusi normal maka menggunakan koefisien korelasi spearman dengan rumus sebagai berikut:

Rumus korelasi pearson

r =  

\frac{\Sigma (x-x)(y-y)}{\sqrt{\Sigma(x- \bar x)^2\Sigma(y- \bar y)^2}}

Rumus korelasi spearman

r=
1-\frac{6\Sigma d^2}{n(n^2-1)}

di mana, nilai d adalah selisih ranking antara skor butir dan skor total setiap responden

Suatu butir pertanyaan dikatakan valid apabila nilai koefisien korelasinya lebih besar dari nilai koefisien korelasi tabel spearman pada taraf signifikan α yang ditentukan oleh peneliti. Penelitian ini menggunakan taraf signifikan α sebesar 5%.

Pertanyaannya adalah, kapan si kita menggunakan korelasi pearson dan kapan menggunakan korelasi spearman? Kedua korelasi tersebut menggambarkan nilai validitas, akan tetapi untuk penggunaannya akan berbeda dimana korelasi pearson digunakan untuk data yang berdistribusi normal atau biasanya skala datanya yaitu skala interval atau rasio, sedangkan korelasi spearman digunakan untuk data yang tidak berdistribusi normal atau biasanya data berskala nominal atau ordinal.

UJI RELIABILITAS

Uji Reliabilitas di definisikan sebagai sejauh mana suatu instumen penelitian secara konsisten memiliki hasil yang sama jika digunakan dalam situasi yang sama pada kesempatan yang berulang. Menurut Karras (1997), Besaran reliabilitas menggunakan rumus cronbach alpha sebagai berikut:

\alpha=
\frac{N}{N-1}(1-\frac{\Sigma \sigma^2(Y_i)}{\sigma_t^2})

di mana, N adalah banyaknya item, \sum\sigma^{2}(Y_{i}) adalah jumlah varian item, dan \sigma _{t}^{2} adalah varian total. Kuisioner dikatakan reliabel apabila memiliki nilai Cronbach alpha lebih dari 0,8.

Penutup

Nah, jelas kan penjelasan dari Exsight, pokoknya penting banget deh uji validitas dan reliabilitas ini untuk keperluan kuesioner kamu agar nantinya data yang dihasilkan berkualitas dan dapat kamu manfaatkan untuk penelitiannya kamu. Semoga bermanfaat ya. Atau jika kamu masih penasaran dengan uji validitas dan reliabilitas, jangan sungkan untuk bertanya di kolom komentar atau menghubungi admin melalui tombol WA.

See you di artikel selanjutnya!

REFERENSI

Karras, D. J. (1997). Statistical Methodology: II. Reliability and Validity Assessment in Study Design, Part A. Academic Emergency Medicine, 4(1), 64–71.

Heale, R., & Twycross, A. (2015). Validity and reliability in quantitative studies. Evidence Based Nursing, 18(3), 66–67. doi:10.1136/eb-2015-102129 

Uji Validitas dan Reliabilitas pada Data Kuesioner Penelitian Read More »

clustering

Belajar Mengenal K-Means Clustering Part (1)

Hai sobat Exsight, kamu pernah menjumpai data yg memiliki banyak jenis dan bingung cara mengelompokkannya? Dalam ilmu statistika ada loh satu metode yang bisa kamu gunakan untuk menganalisis hal tersebut. Metode ini bisa dijadikan salah satu referensi untuk kamu loh. penasaran seperti apa? yuk baca secara lengkap penjelasan berikut ini yaa 😊

Pengertian Clustering

Clustering adalah sebuah metode statistika yang digunakan untuk mengidentifikasi sub kelompok dalam data sedemikian rupa sehingga data dalam kelompok (cluster) yang sama memiliki karakteristik sangat mirip sedangkan data dalam kelompok yang berbeda memiliki karakteristik sangat berbeda. Dengan kata lain, sub kelompok yang homogen dalam data sehingga data di setiap cluster semirip mungkin menurut ukuran kesamaan berdasarkan jarak euclidean. Apabila terdapat n obyek dan p variabel, maka observasi dengan i=1,2,…, n dan j = 1,2,…,p dapat digambarkan sebagai berikut:

 Variabel 1Variabel 2…Variabel p
Objek 1X11X12…X1p
Objek 2X21X22…X2p
. .. .. .. .. .
Objek nXn1Xn2…Xnp

Fungsi jarak euclidean digunakan untuk mengukur jarak titik objek satu dengan objek yang lainnya. Jarak euclidean dirumuskan sebagai berikut:

jarak euclidean clustering

dimana, p = banyak variabel yang diamati

d(i,j) = jarak antara objek i dan objek j

xik = nilai objek i pada variabel yang diamati

xjk = nilai objek j pada variabel yang diamati

Clustering banyak digunakan dalam berbagai hal seperti pada business intelligence, pengenalan pola citra, keamanan, dan segmentasi pasar dimana biasanya digunakan untuk mencari pelanggan yang mirip satu sama lain baik dari segi perilaku atau atribut yang sedang dicari. Terdapat dua jenis data clustering yang sering dipergunakan dalam proses pengelompokan data yaitu Hierarchical dan Non-Hierarchical, dan pada kesempatan kali ini admin akan membahas salah satu algoritma pengelompokan yang paling banyak digunakan yaitu K-Means Clustering yang merupakan salah satu metode data clustering non-hierarchical.

Algoritma K-Means

Algoritma kmeans merupakan algoritma iteratif dimana akan mempartisi kumpulan data ke dalam cluster yang berbeda dan tidak akan tumpang tindih karena setiap data hanya dimiliki oleh satu kelompok. Hal ini dilakukan agar data dalam satu kelompok (intra-cluster) menjadi semirip mungkin sehingga jumlah jarak kuadrat antara titik data dan pusat cluster adalah minimum dan juga menjaga jarak antar cluster sejauh mungkin. Semakin sedikit variasi yang dimiliki dalam cluster, semakin homogen data berada dalam cluster yang sama.

Tahap algoritma K-Means Clustering mengikuti langkah-langkah sebagai berikut:

  1. Tentukan jumlah cluster K
  2. Tetapkan nilai awal titik pusat (centroid) terlebih dahulu dengan mengacak data dan kemudian secara acak pilih K titik data untuk centroid tanpa penggantian.
  3. Lakukan iterasi sampai tidak ada perubahan pada titik pusat yaitu penetapan titik data ke cluster tidak berubah (tetap).
  4. Hitung jumlah kuadrat jarak antara titik data dan semua titik pusat.
  5. Tetapkan setiap titik data ke cluster terdekat
  6. Hitung titik pusat untuk cluster dengan mengambil rata-rata dari semua titik data yang dimiliki setiap cluster.

Asumsi-Asumsi K-Means Clustering

Sebelum melakukan tahap pengelompokan, perlu dicek terlebih dahulu syarat yang harus dipenuhi yaitu:

  • Sampel mewakili populasi

Untuk mengecek apakah sampel sudah mewakili populasi atau belum, dibutuhkan nilai Kaiser-Meyer-Olkin (KMO), dimana nilai KMO yang lebih dari 0,5 menandakan bahwa sampel yang diambil dapat mewakili populasi yang ada.

  • Tidak terjadi multikolinearitas

Untuk mengecek tidak terjadinya multikolinearitas dibutuhkan nilai Variance Inflation Factor (VIF) yang dirumuskan sebagai berikut:

VIF=
\frac{1}{1-R_t^2}

dengan R adalah koefisien determinasi

Asumsi terpenuhi apabila nilai VIF < 10 sehingga tidak terjadi multikolinearitas.

Penutup

Nah, jelas kan penjelasan dari admin bahwa clustering bisa banget kamu gunakan sebagai solusi jika menemukan data dengan berbagai jenis atau kelompok yang cukup rumit agar bisa dikelompokkan berdasarkan kemiripannya dan bisa membantumu menarik kesimpulan dari data yang kamu dapatkan. Semoga bermanfaat ya! Jika kamu masih penasaran dengan algoritma clustering lainnya, jangan sungkan untuk bertanya di kolom komentar atau menghubungi admin melalui tombol WA.

See you di artikel selanjutnya!

Baca juga: Belajar Aplikasi R untuk Pemula

Referensi

  1. https://towardsdatascience.com/k-means-clustering-algorithm-applications-evaluation-methods-and-drawbacks-aa03e644b48a
  2. https://www.yumpu.com/en/document/read/29326175/an-overview-on-clustering-methods-arxiv
  3. https://geospasialis.com/k-means-clustering/

Belajar Mengenal K-Means Clustering Part (1) Read More »

Hubungi Admin
Halo, selamat datang di Exsight! 👋

Hari ini kita ada DISKON 20% untuk semua transaksi. Klaim sekarang!