Dini Ramadhani

distribusi binomial

Analisis Korespondensi : Konsep Dasar

Hai sobat Exsight! Selamat datang di artikel kami. Dalam dunia analisis data, memahami hubungan antar kategori dalam data kualitatif adalah salah satu langkah penting untuk menggali wawasan yang bermanfaat. Salah satu pendekatan yang sering digunakan untuk tujuan ini adalah analisis korespondensi.

Sebagai salah satu metode eksplorasi data yang populer, analisis korespondensi menawarkan cara yang intuitif untuk memvisualisasikan dan memahami hubungan antar kategori yang ada dalam sebuah dataset. Keunggulannya terletak pada kemampuannya untuk merangkum data kompleks ke dalam bentuk yang lebih sederhana tanpa kehilangan informasi penting.

Pada artikel ini, kita akan mempelajari teori dasar di balik analisis korespondensi. Dengan pemahaman yang kuat terhadap konsep ini, Anda dapat membangun fondasi yang kokoh sebelum mempelajari penerapannya lebih lanjut. Jadi, mari kita mulai perjalanan untuk memahami metode analisis ini, dan bagaimana ia dapat menjadi alat yang sangat berharga dalam analisis data kualitatif!

Analisis Korespondensi

Analisis korespondensi atau Correspondence Analysis (CA) adalah teknik statistik multivariat yang digunakan untuk mempelajari hubungan antara dua atau lebih peubah kualitatif. Teknik ini digunakan untuk mengeksplorasi data dari sebuah tabel kontingensi menjadi sebuah grafik .

Analisis korespondensi ini memperlihatkan baris dan kolom dari matriks data sebagai titik-titik dalam sebuah grafik yang memiliki dimensi lebih rendah dengan menggunakan jarak Euclid. Analisis korespondensi sering kali diterapkan untuk mengidentifikasi kategori-kategori yang memiliki kesamaan dalam satu variabel, sehingga kategori-kategori tersebut bisa digabungkan menjadi satu kategori tunggal. Metode ini juga dapat digunakan untuk mengidentifikasi kemungkinan keterkaitan antara dua kelompok variabel. Melihat fungsi keduanya, analisis korespondensi dan analisis komponen utama memiliki kesamaan, yaitu sebagai metode untuk mereduksi dimensi data ke dalam bentuk yang lebih sederhana dan kecil. Sementara perbedaan utamanya adalah analisis komponen utama lebih cocok untuk data yang memiliki skala pengukuran kontinu, sedangkan analisis korespondensi lebih sesuai untuk data yang bersifat kategori.

1. Input dalam Analisis Korespondensi

Input dari analisis korespondensi adalah tabel kontingensi yang menggambarkan frekuensi atau distribusi data antar kategori variabel. Tabel ini bisa memiliki dua atau lebih kategori (baris dan kolom) yang menunjukkan hubungan antara kategori-kategori tersebut.

2. Output dalam Analisis Korespondensi

Output dari analisis korespondensi adalah grafik korespondensi yang memvisualisasikan kedekatan antara kategori dalam dua dimensi. Titik-titik pada grafik menunjukkan kategori-kategori dalam tabel kontingensi, dan jarak antar titik menunjukkan kedekatan atau asosiasi antar kategori.

  • Dimensi pertama menunjukkan hubungan terbesar yang ditemukan dalam data.
  • Dimensi kedua mengungkapkan hubungan tambahan yang mungkin tidak terungkap dalam dimensi pertama.

Dalam plot korespondensi, kategori yang saling terkait atau memiliki hubungan erat akan dikelompokkan berdekatan, sementara kategori yang kurang terkait akan berada di lokasi yang lebih jauh.

3. Fungsi Aktivasi dalam Analisis Korespondensi

Fungsi aktivasi dalam analisis korespondensi berperan untuk mengubah data frekuensi mentah menjadi bentuk yang dapat dianalisis lebih lanjut. Secara matematis, teknik ini melibatkan dekomposisi singular value decomposition (SVD) dari tabel kontingensi untuk mendapatkan representasi data dalam dimensi yang lebih rendah, dengan tujuan untuk mengekstrak struktur utama data.

Pada dasarnya, fungsi aktivasi dalam analisis korespondensi berkaitan dengan cara mengonversi nilai frekuensi ke dalam matriks yang terstandarisasi dan menentukan bobot berdasarkan perbedaan antara kategori yang ada. Setelah pengolahan melalui aktivasi ini, kita dapat menganalisis asosiasi antar kategori, baik dalam bentuk tabel yang lebih mudah dibaca atau dalam bentuk visualisasi seperti grafik atau plot.

Kelebihan dan Kekurangan Analisis Korespondensi

Menurut Saefuloh (2016) kelebihan dan kekurangan analisis korespondensi yaitu sebagai berikut:

Kelebihan:

  1. Cocok untuk menganalisis data dengan variabel kategori ganda yang dapat disajikan dengan mudah dalam bentuk tabel silang.
  2. Tidak hanya menunjukkan hubungan antara baris dan kolom, tetapi juga hubungan antar kategori di dalam setiap baris dan kolom.
  3. Menyediakan visualisasi grafik yang menggabungkan kategori dari baris dan kolom dalam satu gambar dengan dimensi yang seragam.
  4. Fleksibel dalam penggunaannya pada data matriks dengan ukuran besar.

Kekurangan:

  1. Analisis ini kurang tepat untuk pengujian hipotesis, tetapi sangat berguna untuk eksplorasi data.
  2. Tidak memiliki metode khusus untuk menentukan atau memutuskan jumlah dimensi yang optimal.

Langkah-langkah untuk Melakukan Analisis Korespondensi

Langkah-langkah yang diperlukan untuk melakukan Analisis Korespondensi diuraikan sebagai berikut:

(1) Membuat matriks kontingensi dua arah

Matriks kontingensi dua arah dibuat untuk menggambarkan hubungan antara dua set variabel. Dalam proses ini, data dikumpulkan dari sumber tertentu, seperti survei, wawancara, atau pengamatan, di mana responden atau pengamat menentukan apakah terdapat hubungan antara dua variabel

Variabel pertama direpresentasikan sebagai baris matriks, dan variabel kedua sebagai kolom. Setiap elemen matriks diisi berdasarkan kriteria tertentu, seperti pemberian skor 1 untuk menunjukkan adanya hubungan dan skor 0 jika tidak ada hubungan. Data dari berbagai sumber atau responden kemudian digabungkan untuk membentuk matriks kontingensi akhir.

(2) Menghitung matriks frekuensi relatif

Dasar-dasar analisis korespondensi dimulai dari matriks X yang memiliki elemen xij yang tersusun pada tabel frekuensi dua dimensi berukuran I x J. Jika n adalah total frekuensi data matriks X, langkah pertama yang dilakukan adalah menyusun matriks korespondensi P={pij} dengan membagi masing-masing elemen dari X dengan n. Persamaan tersebut dinyatakan sebagai berikut:

p_{ij} = \frac{x_{ij}}{n}, \quad (i = 1, 2, \ldots, I, \; j = 1, 2, \ldots, J)

Matriks korespondensi ( P ) dapat dituliskan dalam bentuk:

P = \begin{pmatrix}
p_{11} & p_{12} & \cdots & p_{1J} \\
p_{21} & p_{22} & \cdots & p_{2J} \\
\vdots & \vdots & \ddots & \vdots \\
p_{I1} & p_{I2} & \cdots & p_{IJ}
\end{pmatrix}

(3) Menghitung vektor baris dan kolom

Kemudian, perlu dicari vektor baris dan kolom yang dinotasikan dengan r dan c, serta diagonal matriks Dr dan Dc​ di mana ri>0 untuk i=1,2,…,I dan cj>0 untuk j=1,2,…,J. Sehingga didapatkan persamaan sebagai berikut:

r_{i} =\sum_{j=1}^{J} p_{ij}= \frac{1}{n} \sum_{j=1}^{J} x_{ij} \quad \text{dan} \quad c_{j} =\sum_{i=1}^{I} p_{ij} = \frac{1}{n} \sum_{i=1}^{I} x_{ij}

(4) Menghitung diagonal massa matriks baris dan kolom serta diagonal massa matriks akar kuadrat

Menghitung diagonal massa matriks baris dan kolom serta diagonal massa matriks akar kuadrat yaitu sebagai berikut:

D_r = \text{diagonal}(r_1, r_2, \ldots, r_I), \quad D_c = \text{diagonal}(c_1, c_2, \ldots, c_J)

Di mana ri adalah massa baris dan cj adalah massa kolom. Cara menghitung diagonal massa matriks yaitu sebagai berikut:

\begin{align*}
D_r^{\frac{1}{2}} &= \text{diag}(\sqrt{r_1}, \ldots, \sqrt{r_I}),\ 
D_r^{-\frac{1}{2}} &= \text{diag}\left(\frac{1}{\sqrt{r_1}}, \ldots, \frac{1}{\sqrt{r_I}}\right)\\
D_c^{\frac{1}{2}} &= \text{diag}(\sqrt{c_1}, \ldots, \sqrt{c_J}),\
D_c^{-\frac{1}{2}} &= \text{diag}\left(\frac{1}{\sqrt{c_1}}, \ldots, \frac{1}{\sqrt{c_J}}\right)
\end{align*}

(5) Menghitung Profil Baris dan Kolom

Profil baris dan profil kolom dari matrik P diperoleh dengan cara membagi vektor baris dan vektor kolom dengan masing masing massanya. Matriks profil baris (R) dan profil kolom (C) dinyatakan oleh: Profil matriks baris dan kolom.

R=D_r^{-1}P
 = \begin{pmatrix}
\tilde{r}_1^{T} \\
\vdots \\
\tilde{r}_I^{T} 
\end{pmatrix}
C=D_c^{-1}P^{T}
 = \begin{pmatrix}
\tilde{c}_1^{T} \\
\vdots \\
\tilde{c}_J^{T} 
\end{pmatrix}

dimana

\tilde{r}_{ij} = \frac{P_{ij}}{r_{i}} \quad \text{dan} \quad \tilde{c}_{ij} = \frac{P_{ij}}{c_{j}} , \quad j = 1, 2, \ldots, J, \quad i = 1, 2, \ldots, I

(6) Singular Value Decomposition (SVD)

Singular Value Decomposition (SVD) adalah sebuah metode penting dalam aljabar matriks dan dekomposisi eigen yang melibatkan nilai dan vektor eigen. Metode ini bertujuan untuk mereduksi dimensi data berdasarkan variabilitas maksimum (nilai eigen atau inersia), sambil tetap menjaga informasi yang paling relevan.

Nilai singular dihitung untuk mendapatkan koordinat baris dan kolom, sehingga hasil analisis korespondensi dapat divisualisasikan dalam bentuk grafik. Proses Singular Value Decomposition (SVD) serta matriks korespondensi dapat dinyatakan dalam persamaan berikut

P-rc^{T} = \sum_{k=1}^{K} \lambda_k \left( D_{r}^{\frac{1}{2}} u_k \right) \left( D_{c}^{\frac{1}{2}} v_k \right)^{T}

Dimana :

\begin{align*}
P-rc^{T} &= \text{nilai singular dekomposisi umum dari matriks } P \text{ atau matriks korespondensi}, \\ 
\lambda_k &= \text{nilai singular yang merupakan akar kuadrat dari nilai eigen matriks } P, \\ 
u_k &= \text{vektor berukuran } (I \times 1), \\ 
v_k &= \text{vektor berukuran } (J \times 1), \\ 
k &= \text{nilai rank yang menunjukkan jumlah solusi dimensi dalam matriks } P, \\ 
& \quad k = 1, 2, \ldots, K\text{ di mana } k = \min(I - 1, J - 1).
\end{align*}

Sementara itu persamaan dalam menentukan koordinat profil dan kolom dapat didefinisikan sebagai berikut.

\text{Koordinat profil baris: } \quad 
\ F=  {\lambda_k} D_r^{-1/2} u_k\\

\text{Koordinat profil kolom: } \quad 
\ G=  {\lambda_k} D_c^{-1/2} v_k\\

(6) Menilai Kesesuaian Model
Persentase inersia (mirip dalam regresi) dihitung untuk menilai seberapa baik model menjelaskan data. Dimensi yang dipilih harus menjelaskan lebih dari 80% inersia kumulatif. Jika kurang, data perlu diperiksa ulang atau disesuaikan.

(7) Membuat Peta Persepsi
Menggunakan koordinat hasil analisis untuk memvisualisasikan hubungan antara baris (kategori) dan kolom (variabel). Peta ini membantu memahami kontribusi dan asosiasi antar elemen secara lebih intuitif.

Penerapan Analisis Korespondensi dalam Berbagai Bidang

Berikut ini adalah penerapan analisis korespondensi dalam berbagai bidang:

1. Bidang Teknologi

Analisis Korespondensi

Di industri teknologi, khususnya dalam pemetaan perilaku pengguna smartphone, analisis korespondensi digunakan untuk plot korespondensi bersama untuk mengetahui apakah konsumen berpindah dari satu jenis ke jenis smartphone lainnya, serta mengetahui apa yang menjadi pertimbangan responden saat membeli smartphone. Dengan menambahkan data variabel waktu pada metode joint korespondensi, perubahan perilaku konsumen dapat ditentukan dalam waktu tertentu.

2. Bidang Pendidikan

Analisis Korespondensi

Dalam bidang pendidikan, analisis korespondensi diterapkan untuk memetakan hubungan antara variabel lama studi, IPK, dan lama skripsi di kalangan alumni. Penelitian yang dilakukan di Universitas Sriwijaya menggunakan analisis korespondensi untuk membandingkan dua jenis konfigurasi data, yaitu analisis korespondensi sederhana dan berganda. Hasil penelitian menunjukkan hubungan yang signifikan antara lama studi dan IPK alumni (95,86%). Sedangkan hasil analisis Procrustes pada konfigurasi hasil analisis korespondensi sederhana dan analisis korespondensi berganda pada hubungan Lama Studi dan Lama Skripsi tingkat kemiripannya sebesar 64,89%.

3. Bidang Kesehatan

Analisis Korespondensi

Di sektor kesehatan ada sebuah penelitian yang membahas tentang sebaran mengenai jumlah fasilitas tenaga kesehatan berdasarkan provinsi di Indonesia. Penelitian ini menggunakan analisis korespondensi untuk eksplorasi data dari sebuah tabel kontingensi yang bertujuan untuk melihat ada tidaknya hubungan antara variabel secara visual, dan digunakan untuk melihat kedekatan suatu kategori pada satu peubah terhadap kategori peubah lainnya. Didapatkan hasil bahwa dari grafik korespondensi bidan merupakan jumlah tenaga kesehatan yang paling banyak tersebar di sebagian besar Provinsi di Indonesia, dan jumlah tenaga kesehatan yang paling sedikit tersebar di sebagian besar provinsi di Indonesia adalah dokter gigi.

Selain yang disebutkan di atas secara umum beberapa penerapan utama metode ini yaitu sebagai berikut:

  • Ritel: memahami pola tata letak toko dan kinerja jenis produk tertentu
  • Riset pasar: menganalisis respons terhadap kampanye bertarget berdasarkan berbagai faktor demografi
  • UX design: melacak data tentang cara pengguna berinteraksi dengan antarmuka agar lebih intuitif dan mudah dinavigasi
  • Sumber daya manusia: memahami pola potensial dalam kepuasan dan pengurangan karyawan
  • Layanan Kesehatan: meninjau korelasi apa pun antara hasil pasien dan aspek pengobatan mereka

Referensi

Bangun, P. B., Irmeilyana, I., & Anasari, A. (2012). Penerapan Analisis Procrustes pada Grafik Hasil Analisis Korespondensi Hubungan Lama Studi, IPK, dan Lama Skripsi Alumni Matematika FMIPA Unsri Angkatan 2002Jurnal Penelitian Sains15(1).

Dewi, I. W., Mustafid, M., & Hoyyi, A. (2014). Penerapan Metode Korespondensi Bersama Untuk Analisis Perubahan Perilaku Pengguna SmartphoneJurnal Gaussian3(3), 451-460.

Dovetail. (n.d.). Correspondence analysis. diakses Desember 28, 2024, dari https://dovetail.com/market-research/correspondence-analysis/

Rahmah, P. F., Asnawi, M. H., Nugraha, A., & Purwandari, T. (2021, Desember). Penerapan Analisis Korespondensi untuk Memetakan Provinsi-Provinsi di Indonesia berdasarkan Jumlah Tenaga Kesehatan. In E-Prosiding Seminar Nasional Statistika| Departemen Statistika FMIPA Universitas Padjadjaran (Vol. 10, pp. 52-59).

Maiti, J. [nptelhrd]. (2014). Mod-01 lec-41 correspondence analysis [File video]. Tersedia di: https://www.youtube.com/watch?v=jr47E7MZfwY

Purbawati, I. (2015). Analisis Kecenderungan Jenis Kontrasepsi Peserta KB Aktif di Kabupaten/Kota Provinsi Jawa Timur Menggunakan Metode Analisis Korespondensi. Skripsi

Saefuloh, N. A. (2016). Analisis Korespondensi, Alternatif Uji Statistik Penelitian (Hubungan Tingkat Pendidikan dan Penghasilan Orangtua dengan Nilai Raport Matematika Siswa)Euclid3(1).

Tarei, P. K., Thakkar, J. J., & Nag, B. (2020). Benchmarking the relationship between supply chain risk mitigation strategies and practices: an integrated approachBenchmarking: An International Journal27(5), 1683-1715.

Sampai di sini dulu penjelasan terkait Analisis Korespondensi : Konsep Dasar. Apabila sobat Exsight masih ada yang dibingungkan terkait pembahasan pada artikel ini, bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya. See you in the next article yaa!

Analisis Korespondensi : Konsep Dasar Read More »

Analisis Segmentasi Pelanggan | Konsep

Hai Sobat Exsight! Selamat datang di artikel kami 😊. Artikel ini akan membahas mengenai metode analisis data yang dapat membantu untuk memahami perilaku dan preferensi pelanggan. Teknik yang umum digunakan yaitu analisis segmentasi pelanggan. Teknik ini memungkinkan perusahaan mengelompokkan pelanggan berdasarkan karakteristik tertentu untuk mengembangkan strategi yang lebih terarah dan efektif.

Segmentasi pelanggan telah menjadi elemen penting dalam dunia pemasaran dan bisnis modern. Dengan memahami konsep dasarnya, bisnis dapat lebih fokus memenuhi kebutuhan pelanggan, meningkatkan pengalaman, dan membangun loyalitas yang lebih kuat.

Pada artikel ini akan dibahas mengenai konsep dasar analisis segmentasi pelanggan, jenis-jenis segmentasi yang umum digunakan, dan manfaatnya dalam berbagai situasi bisnis.

Apakah Anda seorang pemilik bisnis, pemasar, atau data analyst yang ingin lebih memahami pelanggan Anda? Artikel ini adalah panduan yang tepat. Jadi, siapkan catatan Anda, dan mari kita mulai eksplorasi menarik tentang analisis segmentasi pelanggan ini! 😊

Analisis Segmentasi Pelanggan

Analisis segmentasi pelanggan adalah proses mengidentifikasi dan mengelompokkan pelanggan berdasarkan karakteristik, perilaku, dan kebutuhan yang serupa untuk memahami preferensi dan harapan mereka. Tujuan dari analisis ini adalah untuk menciptakan pemahaman yang mendalam tentang berbagai segmen pasar yang ada, sehingga perusahaan dapat menyesuaikan produk, layanan, dan strategi pemasaran mereka dengan lebih efektif.

Manfaat Analisis Segmentasi Pelanggan

Implementasi segmentasi pelanggan memberikan banyak manfaat bagi bisnis. Beberapa keuntungan kunci termasuk:

  • Targeting yang lebih baik dalam kampanye pemasaran: Segmentasi memungkinkan bisnis untuk memahami kelompok pelanggan mana yang paling mungkin merespons pesan pemasaran tertentu. Ini berarti kampanye dapat lebih terfokus, mengurangi pemborosan, dan meningkatkan peluang keberhasilan.
  • Peningkatan kepuasan dan retensi pelanggan: Pelanggan yang merasa dipahami dan dihargai lebih cenderung tetap loyal terhadap suatu merek. Segmentasi pelanggan membantu bisnis memberikan pengalaman yang dipersonalisasi yang mendorong kepuasan pelanggan, yang pada akhirnya meningkatkan tingkat retensi.
  • Peningkatan profitabilitas: Bisnis dapat meningkatkan tingkat konversi dan menghasilkan lebih banyak pendapatan dengan menargetkan pelanggan dengan penawaran yang sesuai. Misalnya, sebuah perusahaan dapat menggunakan segmentasi berbasis nilai untuk mengidentifikasi pelanggan dengan pengeluaran tinggi dan menawarkan promosi eksklusif, sehingga meningkatkan penjualan dan loyalitas pelanggan.
  • Wawasan pengembangan produk: Segmentasi pelanggan juga memberikan wawasan berharga tentang preferensi produk. Ketika menganalisis kebutuhan dari berbagai segmen pelanggan, bisnis dapat mengembangkan produk dan layanan yang memenuhi preferensi ini, yang mengarah pada kepuasan yang lebih tinggi dan kinerja penjualan yang lebih baik.

Karakteristik Pelanggan

Terdapat beberapa cara pendekatan untuk memahami karakteristik pelanggan, yaitu:

  • Segmentasi Demografis
    Segmentasi ini mengelompokkan pelanggan berdasarkan faktor demografis seperti umur, jenis kelamin, ukuran keluarga, pendidikan, pekerjaan, dan status sosial ekonomi. Ini membantu perusahaan memahami siapa pelanggan mereka dan bagaimana karakteristik demografis memengaruhi perilaku pembelian.
  • Segmentasi Psikografis
    Dalam segmentasi ini, pelanggan dikelompokkan berdasarkan kepribadian, gaya hidup, nilai-nilai, dan sikap. Psikografi memberikan wawasan yang lebih dalam tentang motivasi dan preferensi pelanggan, yang dapat digunakan untuk menyesuaikan penawaran produk dan strategi pemasaran.
  • Segmentasi Perilaku
    Segmentasi perilaku mengelompokkan pelanggan berdasarkan perilaku mereka dalam menggunakan produk atau layanan, seperti manfaat yang dicari, frekuensi pembelian, dan tingkat penggunaan. Ini membantu perusahaan memahami pola pembelian dan kebutuhan pelanggan yang lebih spesifik.
  • Segmentasi Geografis
    Segmentasi ini mengelompokkan pelanggan berdasarkan lokasi geografis, seperti negara, provinsi, kota, atau bahkan kode pos. Faktor iklim dan budaya lokal juga dapat dipertimbangkan dalam segmentasi geografis, sehingga perusahaan dapat menyesuaikan penawaran mereka berdasarkan kondisi spesifik di suatu area.

Segmentasi berdasarkan nilai RFM

Sedangkan menurut Adiana, dkk (2018) Segmentasi pelanggan dibagi menjadi 6 karakteristik berdasarkan nilai RFM (Recency, Frequency, Monetary) seperti berikut:

  1. Superstar:
    • Pelanggan dengan loyalitas yang sangat tinggi
    • Memiliki nilai monetari yang tinggi.
    • Mempunyai frekuensi transaksi yang tinggi.
    • Melakukan transaksi paling banyak.
  2. Golden Customer:
    • Memiliki nilai monetari tertinggi kedua.
    • Frekuensi transaksi yang tinggi.
    • Mempunyai rata-rata transaksi yang baik.
  3. Typical Customer:
    • Memiliki rata-rata nilai monetari dan rata-rata transaksi yang berada pada level rata-rata.
  4. Occasional Customer:
    • Memiliki nilai monetari terendah kedua setelah dormant customer.
    • Memiliki nilai recency yang paling rendah.
    • Melakukan transaksi dengan frekuensi yang tinggi.
  5. Everyday Shopper:
    • Menunjukkan peningkatan dalam jumlah transaksi.
    • Mempunyai tingkat transaksi yang rendah.
    • Memiliki nilai monetari yang sedang hingga rendah.
  6. Dormant Customer:
    • Memiliki frekuensi dan nilai monetari yang paling rendah.
    • Memiliki nilai recency yang paling rendah.

Teknik untuk Analisis Segmentasi

Analaisis Segmentasi Pelanggan

Teknik yang telah digunakan oleh beberapa peneliti sebelumnya yaitu sebagai berikut:

1. K-Means

Salah satu metode clustering yang populer dan banyak diteliti untuk meminimalkan kesalahan pengelompokan dalam ruang Euclidean adalah K-Means clustering . Pendekatan ini termasuk dalam kategori clustering tipe partisi. K-Means menggunakan strategi greedy (serakah) dengan membuat partisi baru melalui penugasan setiap data ke pusat klaster terdekat, diikuti dengan penghitungan ulang pusat klaster. Metode ini mengelompokkan data tertentu ke dalam sejumlah klaster (k cluster). Konsep dasarnya adalah menentukan k pusat (k centroid), masing-masing mewakili satu klaster. Penempatan awal pusat ini harus dipertimbangkan dengan cermat, karena lokasi yang berbeda dapat menghasilkan hasil pengelompokan yang berbeda.

2. DBSCAN (Density-Based Spatial Clustering of Applications with Noise)

DBSCAN (Density Based Spatial Clustering of Applications with Noise) adalah algoritma clustering yang bekerja dengan memperluas klaster berdasarkan sampel inti (core sample). Algoritma ini menggunakan dua parameter utama untuk menentukan klaster. Parameter pertama adalah jumlah minimum titik yang diperlukan untuk membentuk core sample, yang berfungsi untuk menentukan batas tingkat kebisingan. Parameter kedua adalah ε (epsilon), yang mengacu pada radius maksimum di mana titik-titik dapat dianggap sebagai tetangga satu sama lain.

3. Hierarchical Clustering

Hierarchical Clustering adalah algoritma pengelompokan data yang dimulai dengan menganggap setiap observasi sebagai klaster terpisah, kemudian secara bertahap menggabungkannya ke dalam kelompok yang lebih besar. Proses ini dikenal sebagai pendekatan bottom-up. Pendekatan hierarchical dalam analisis klaster dapat dibagi menjadi dua metode utama: Agglomerative, yaitu metode dimana setiap objek awalnya dianggap sebagai klaster individual. Kemudian, dua objek dengan tingkat ‘kemiripan’ tertinggi digabungkan menjadi satu klaster, dan proses ini berlanjut sampai semua objek tergabung menjadi satu klaster besar dan Divisive, yaitu metode dimana dimulai dengan satu klaster yang mencakup semua objek atau pengamatan. Objek yang memiliki perbedaan paling besar dalam ‘kemiripan’ secara bertahap dipisahkan dari klaster, hingga setiap objek menjadi klaster tersendiri.

4. K-Medoids

Algoritma K-Medoids, atau dikenal juga sebagai algoritma PAM (Partitioning Around Medoid), adalah metode clustering yang dirancang untuk mengatasi kelemahan K-Means yang cenderung sensitif terhadap outlier, karena objek dengan nilai besar dapat menyimpang jauh dari distribusi data. Berbeda dengan K-Means yang menggunakan mean sebagai pusat klaster, K-Medoids menggunakan medoid, yaitu objek data yang paling representatif atau paling sentral dalam suatu klaster. Dalam algoritma ini, K objek dipilih secara acak sebagai medoid untuk mewakili klaster, dan setiap objek data lainnya ditugaskan ke klaster yang memiliki medoid terdekat.

5. Metode Fuzzy C-Means

Fuzzy C-Means adalah metode clustering yang menentukan keberadaan setiap titik data dalam suatu klaster berdasarkan derajat keanggotaan. Fuzzy merepresentasikan himpunan dengan batas keanggotaan yang tidak didefinisikan secara tegas berdasarkan terpenuhinya suatu syarat. Konsep dasar Fuzzy C-Means melibatkan penentuan pusat klaster sebagai langkah awal untuk menandai rata-rata lokasi setiap klaster. Pada tahap awal, posisi pusat klaster belum sepenuhnya akurat. Setiap titik data memiliki derajat keanggotaan terhadap setiap klaster. Dengan memperbarui pusat klaster dan derajat keanggotaan secara iteratif, pusat klaster akan bergerak menuju posisi yang lebih tepat.

Contoh Penerapan Segmentasi Pelanggan dalam Bisnis

Segmentasi pelanggan dapat diterapkan di berbagai bidang bisnis untuk memahami kebutuhan dan preferensi pelanggan dengan lebih baik. Berikut adalah beberapa contoh penerapan segmentasi pelanggan yang disesuaikan dengan bidang bisnisnya:

1. Bidang Kecantikan

Salon Nuii Beauty Glow beroperasi di industri kecantikan yang kompetitif, di mana pemahaman tentang karakteristik pelanggan sangat penting. Dengan menggunakan algoritma K-Means Clustering, salon ini dapat mengelompokkan pelanggannya berdasarkan karakteristik yang relevan. Penelitian ini menghasilkan tiga cluster pelanggan, dengan cluster 0 sebagai kelompok terbesar yang terdiri dari 48 pelanggan, cluster 1 memiliki 10 pelanggan, dan cluster 3 memiliki 12 pelanggan. Uji indeks Davies Bouldin digunakan untuk mengevaluasi kualitas cluster, dan model RFM (Recency, Frequency, Monetary) digunakan untuk memfasilitasi pengelompokan.

2. Bidang Retail Online

 Analisis Segmentasi Pelanggan

Di sektor retail online, pemahaman yang mendalam mengenai pelanggan sangat penting untuk meningkatkan pengalaman belanja. Sebuah penelitian menerapkan K-Means Clustering untuk segmentasi pelanggan berdasarkan perilaku belanja mereka. Dengan menggunakan pemrograman Python, analisis dilakukan melalui metode elbow untuk menentukan jumlah cluster yang optimal, yang ditemukan sebanyak empat cluster. Setiap cluster memiliki karakteristik spesifik, seperti kuantitas dan harga satuan, yang berpengaruh terhadap perilaku pembelian pelanggan. Strategi pemasaran yang disesuaikan dengan setiap segmen pelanggan dapat meningkatkan efektivitas penawaran produk dan komunikasi dengan pelanggan.

3. Bidang Farmasi

PT. Abbott Indonesia, yang bergerak di industri farmasi, memerlukan pemahaman yang baik tentang karakteristik pelanggannya untuk merumuskan strategi pemasaran yang efektif. Penelitian ini menggunakan kombinasi RFM Model, K-Means Clustering, dan Rough Set Theory untuk melakukan segmentasi pelanggan. Model RFM digunakan sebagai atribut kuantitatif untuk variabel masukan, sementara K-Means mengelompokkan pelanggan ke dalam segmen yang berbeda. Hasil analisis menunjukkan empat segmen pelanggan dengan karakteristik yang unik dan menghasilkan 31 aturan klasifikasi dengan akurasi 95%. Segmentasi ini membantu perusahaan dalam memprioritaskan sumber daya dan strategi pemasaran, meningkatkan efisiensi dan kepuasan pelanggan.

Referensi

Adiana, B. E., Soesanti, I., & Permanasari, A. E. (2018). Analisis segmentasi pelanggan menggunakan kombinasi RFM model dan teknik clusteringJurnal Terapan Teknologi Informasi2(1), 23-32.

Awalina, E. F. L., & Rahayu, W. I. (2023). Optimalisasi Strategi Pemasaran dengan Segmentasi Pelanggan Menggunakan Penerapan K-Means Clustering pada Transaksi Online RetailJurnal Teknologi Dan Informasi13(2), 122-137.

HUSNA, A. (2015). Segmentasi Pelanggan Menggunakan Model RFM dan Teori Rough Set Untuk Memahami Karakteristik Pelanggan (Studi Kasus: PT. Abbott Indonesia, Tbk Cabang Malang). Skripsi

Mirantika, N., Syamfithriani, T. S., & Trisudarmo, R. (2023). Implementasi Algoritma K-Medoids Clustering Untuk Menentukan Segmentasi PelangganNUANSA INFORMATIKA17(1), 196-204.

Sajidah, S., & Herdiana, R. (2023). Segmentasi Pelanggan Salon Nuii Beauty Glow Menggunakan K-Means ClusteringJATI (Jurnal Mahasiswa Teknik Informatika)7(1), 558-566.

Taqwim, W. A., Setiawan, N. Y., & Bachtiar, F. A. (2019). Analisis segmentasi pelanggan dengan rfm model pada PT. arthamas citra mandiri menggunakan metode fuzzy c-means clusteringJurnal Pengembangan Teknologi Informasi dan Ilmu Komputer3(2), 1986-1993.

Wardani, S. D. K., Ariyanto, A. S., Umroh, M., & Rolliawati, D. (2023). Perbandingan Hasil Metode Clustering K-Means, Db Scanner & Hierarchical Untuk Analisa Segmentasi PasarJIKO (Jurnal Informatika dan Komputer)7(2), 191-201.

Wavetec. (n.d.). Customer segmentation: Benefits & definition. diakses Desember 28, 2024,dari https://www.wavetec.com/blog/customer-segmentation-benefits-definition/

Widiyanto, A. T., & Witanti, A. (2021). Segmentasi Pelanggan Berdasarkan Analisis RFM Menggunakan Algoritma K-Means Sebagai Dasar Strategi Pemasaran (Studi Kasus PT Coversuper Indonesia Global)KONSTELASI: Konvergensi Teknologi dan Sistem Informasi1(1), 204-215.

Sampai di sini dulu penjelasan terkait Analisis Segmentasi Pelanggan | Konsep. Apabila sobat Exsight masih ada yang dibingungkan terkait pembahasan pada artikel ini, bisa langsung saja ramaikan kolom komentar atau hubungi admin melalui tombol bantuan di kanan bawah. Stay tuned di website https://exsight.id/blog/ agar tidak ketinggalan artikel-artikel menarik lainnya. See you in the next article yaa!

Analisis Segmentasi Pelanggan | Konsep Read More »

Tutorial Grafik C: Pengendalian Atribut

Halo, sobat Exsight! 👋 Apakah Anda pernah merasa kesulitan menjaga kualitas produk atau layanan agar tetap konsisten? Jangan khawatir! Dalam artikel Tutorial Grafik P: Pengendalian Atribut, kita telah membahas cara memantau proporsi unit cacat dalam suatu proses menggunakan Grafik P. Sekarang, saatnya melangkah lebih jauh dengan membahas alat lain yang tak kalah penting dalam Statistical Process Control (SPC), yaitu grafik C!

Sebagai salah satu jenis grafik pengendalian atribut, grafik C dirancang khusus untuk memonitor jumlah kejadian atau cacat dalam suatu proses. Alat ini sangat efektif untuk membantu Anda mengidentifikasi pola atau anomali yang dapat memengaruhi kualitas. Dengan demikian, Anda dapat segera mengambil langkah perbaikan yang tepat waktu, memastikan proses tetap berjalan secara efisien dan sesuai standar.

Menariknya, grafik C tidak hanya terbatas pada aplikasi di industri manufaktur, tetapi juga dapat digunakan di berbagai sektor lainnya, seperti layanan kesehatan, logistik, hingga pendidikan. Dengan grafik C, Anda dapat memantau kualitas secara menyeluruh dan menjaga stabilitas proses demi kepuasan pelanggan.

Jadi, siapkah Anda untuk mempelajari lebih lanjut tentang bagaimana grafik C dapat membantu menjaga kualitas proses Anda? Mari kita mulai pembahasannya dan temukan manfaat besar dari alat ini!

Konsep Dasar Grafik C

Grafik pengendalian atribut berfungsi untuk memantau kualitas produk sepanjang proses produksi, khususnya untuk karakteristik yang tidak dapat diukur secara langsung tetapi dapat dihitung. Metode ini memungkinkan kita untuk mengklasifikasikan kualitas produk ke dalam kategori baik atau buruk, serta berhasil atau gagal. Grafik C dirancang khusus untuk mengindikasikan jumlah kecacatan atau ketidaksesuaian dalam sampel dengan ukuran tetap. Dalam hal ini, setiap produk dianggap sebagai satu unit yang dapat memiliki lebih dari satu cacat, tergantung pada sifat masalah yang ada.

Grafik C juga menggambarkan variansi jumlah cacat dari suatu proses produksi dari waktu ke waktu secara keseluruhan. Untuk menetapkan batas kendali, prinsip distribusi Poisson digunakan, yang memungkinkan analisis yang lebih akurat terhadap jumlah kecacatan dalam proses produksi. Dengan pendekatan ini, kita dapat lebih efektif dalam mengidentifikasi dan mengatasi masalah kualitas yang muncul.

Batas kendali yang ditetapkan dalam grafik C berfungsi sebagai indikator untuk menilai apakah proses berada dalam kendali atau tidak. Jika titik data berada di luar batas kendali, hal ini menunjukkan adanya variasi yang tidak biasa dalam proses yang perlu ditindaklanjuti. Dengan demikian, grafik C bukan hanya berfungsi sebagai alat pemantauan, tetapi juga sebagai dasar untuk analisis yang lebih mendalam terkait kualitas produk.

Setelah menganalisis data dari grafik C, tim kualitas dapat menentukan langkah-langkah perbaikan yang diperlukan. Misalnya, jika terdapat pola atau tren yang menunjukkan peningkatan jumlah cacat, tim dapat melakukan investigasi untuk mencari penyebabnya dan mengambil langkah-langkah yang sesuai untuk perbaikan. Grafik C dapat diterapkan di berbagai industri, termasuk manufaktur, kesehatan, dan layanan, di mana pengendalian kualitas produk dan proses sangat penting. Dengan alat ini, organisasi dapat menjaga standar kualitas yang tinggi dan meningkatkan kepuasan pelanggan, sehingga menciptakan keunggulan kompetitif di pasar.

Langkah-Langkah Dasar Membuat Grafik C

Berikut ini langkah-langkah dasar dalam membuat grafik C

1. Menentukan rata-rata kerusakan

Rata-rata jumlah kerusakan dalam grafik C dihitung untuk menentukan garis pusat (Center Line/CL) yang merepresentasikan nilai rata-rata dari jumlah kerusakan dalam proses produksi yang diamati. Rata-rata jumlah kerusakan untuk grafik C dihitung dengan rumus berikut:

\bar{c} = \frac{\Sigma c}{m}

Keterangan :

\begin{align*}
\bar{c} & = \text{rata-rata jumlah kerusakan} \\
\Sigma c & = \text{jumlah kerusakan} \\
m & = \text{jumlah sampel}
\end{align*}

2. Menentukan standar deviasi

Standar deviasi dalam grafik C digunakan untuk mengukur tingkat penyebaran jumlah kerusakan dari rata-rata. Standar deviasi dalam grafik C dihitung dengan rumus:

\sigma_c = \sqrt{\bar{c}}

Keterangan

\begin{align*}
\sigma_e & = \text{Standar deviasi} \\
\sqrt{\bar{c}} & = \text{Rata-rata jumlah produk rusak}
\end{align*}

3. Menentukan batas pengendalian

Upper Control Limit (UCL) untuk grafik C dihitung dengan rumus:

UCL = \bar{c} + 3 \sqrt{\bar{c}} 

Lower Control Limit (LCL) untuk grafik C dihitung dengan rumus:

LCL = \bar{c} - 3 \sqrt{\bar{c}} 

Jika jumlah kerusakan produksi mendekati batas LCL, ini menunjukkan bahwa kualitas produk yang dihasilkan sangat baik, karena tingkat kerusakan mendekati angka nol (0). Sebaliknya, jika jumlah kerusakan mendekati batas UCL, ini menandakan bahwa kualitas produk tersebut buruk, karena ada penyimpangan kerusakan yang signifikan. Oleh karena itu, hal ini perlu diperhatikan dengan serius, dan tindakan perbaikan harus segera dilakukan untuk meningkatkan kualitas produk dalam proses produksi.

4. Membuat Grafik C

Grafik C
  • Mengumpulkan Data: Kumpulkan data jumlah kerusakan untuk setiap periode waktu yang telah ditentukan. Pengamatan dalam grafik C dapat ditabelkan seperti berikut:
SampelBanyak cacat yang dialami per unit dalam setiap sempel
1C1
2C2
nCm
Contoh tabel pengamatan grafik C
  • Membuat Tabel Data: Buat tabel yang mencakup kolom untuk waktu, jumlah kerusakan, rata-rata C, UCL, dan LCL.
  • Menggunakan Perangkat Lunak: Gunakan perangkat lunak
  • Analisis Grafik: Setelah grafik dibuat, analisis pola kerusakan. Perhatikan jika ada titik data yang melebihi UCL atau di bawah LCL, dan identifikasi penyebab penyimpangan tersebut.

Tutorial Membuat Grafik C dengan R

Sebuah perusahaan percetakan sedang melakukan analisis kualitas untuk memantau stabilitas proses produksi mereka. Salah satu indikator yang diamati adalah jumlah kesalahan cetak (defect) yang terjadi dalam setiap sesi produksi, di mana setiap sesi melibatkan pencetakan 100 halaman. Dalam periode observasi ini, perusahaan mencatat jumlah kesalahan sebagai berikut: pada Sesi 1 terdapat 4 kesalahan, pada Sesi 2 tercatat 2 kesalahan, pada Sesi 3 terjadi peningkatan menjadi 7 kesalahan, dan pada Sesi 4 kembali menurun menjadi 6 kesalahan. Perusahaan ingin memastikan bahwa jumlah kesalahan berada dalam batas kendali statistik dan menganalisis apakah proses produksi tetap stabil.

Untuk menjawab permasalahan ini, grafik C dipilih sebagai alat analisis karena grafik ini dirancang khusus untuk memantau jumlah kejadian diskret, seperti jumlah kesalahan atau cacat dalam proses produksi, terutama ketika ukuran sampel atau unit produksi dalam setiap sesi relatif sama. Dengan menggunakan grafik C, perusahaan dapat menentukan apakah jumlah kesalahan masih berada dalam batas kendali statistik serta mengidentifikasi pola atau variasi yang mungkin mengindikasikan adanya masalah pada proses produksi. Hal ini memungkinkan perusahaan untuk menjaga stabilitas dan konsistensi kualitas produk mereka. Berikut ini adalah langkah-langkah pembuatan grafik C dengan menggunakan R:

1. Siapkan Dataset

Dataset untuk membuat grafik C harus mencakup informasi berikut:

  • Group: Nama sesi atau batch yang diamati.
  • Defects: Jumlah kesalahan cetak dalam setiap sesi.

Berikut ini adalah dataset dalam format tabel:

Sesi (Group)Jumlah Kesalahan (Defects)
14
22
37
46
Tabel pengamatan grafik C

2. Buat Dataset di R

Gunakan fungsi data.frame() untuk membuat dataset di R.

# Membuat dataset langsung di R
data_c <- data.frame(
  group = c("Sesi 1", "Sesi 2", "Sesi 3", "Sesi 4"),
  defects = c(4, 2, 7, 6)
)
data_c
Grafik C

3. Instal dan Muat Paket yang Dibutuhkan

Pada langkah ini, kita menggunakan paket qqc dalam R, yang merupakan alat untuk membuat berbagai jenis grafik pengendalian statistik, termasuk grafik C. Paket ini dirancang untuk membantu analisis Pengendalian Proses Statistik (Statistical Process Control/SPC) dengan mudah. Melalui qqc, kita dapat menghitung batas kendali, memvisualisasikan grafik pengendalian, dan menganalisis stabilitas proses produksi.

install.packages("qcc") # Instal jika belum ada
library(qcc)

4. Buat Grafik C

Berikut adalah sintaks untuk membuat Grafik C:

# Membuat Grafik C
c_chart <- qcc(
  data_c$defects,      # Kolom jumlah kesalahan
  type = "c",          # Jenis grafik C
  labels = data_c$group, # Label untuk sumbu X
  title = "Grafik C: Jumlah Kesalahan Cetak", # Judul grafik
  xlab = "Sesi Produksi", # Label sumbu X
  ylab = "Jumlah Kesalahan" # Label sumbu Y
)

5. Interpretasi Hasil

Grafik C pada gambar menunjukkan analisis jumlah kesalahan cetak dalam empat sesi produksi, dengan tujuan memantau kestabilan proses. Pada sumbu horizontal (X), terdapat nama sesi produksi, yaitu “Sesi 1,” “Sesi 2,” “Sesi 3,” dan “Sesi 4,” sementara sumbu vertikal (Y) menunjukkan jumlah kesalahan yang tercatat pada setiap sesi. Grafik ini dilengkapi dengan garis pusat (CL) yang merepresentasikan rata-rata jumlah kesalahan, yaitu 4,75. Selain itu, terdapat batas kendali atas (UCL) sebesar 11,29 dan batas kendali bawah (LCL) sebesar 0 (karena jumlah kesalahan tidak dapat bernilai negatif).

Dari data, terlihat bahwa jumlah kesalahan untuk semua sesi berada di dalam batas kendali (UCL dan LCL), yang menunjukkan bahwa proses produksi berada dalam kondisi stabil secara statistik. Jumlah kesalahan bervariasi, dengan nilai terendah pada Sesi 2 (2 kesalahan) dan nilai tertinggi pada Sesi 3 (7 kesalahan). Meskipun terdapat fluktuasi antar sesi, tidak ada titik yang melampaui batas kendali atau menunjukkan pola pelanggaran aturan statistik (number violating runs = 0). Hal ini mengindikasikan bahwa proses tidak menunjukkan anomali signifikan atau variasi yang tidak wajar.

Secara keseluruhan, grafik ini menunjukkan bahwa proses produksi berjalan terkendali dan konsisten. Namun, jika perusahaan ingin mengurangi jumlah kesalahan lebih lanjut, analisis mendalam terhadap faktor-faktor yang memengaruhi kesalahan di setiap sesi dapat dilakukan, terutama pada sesi dengan jumlah kesalahan yang lebih tinggi, seperti Sesi 3.

Referensi

Anhoej, J. (2021). Control Charts with qicharts for R. Diakses pada 28 November 2024, dari https://cran.r-project.org/web/packages/qicharts/vignettes/controlcharts.html

Khikmawati, E., Anggraini, M., & Irawan, I. (2018). Analisis Peta Kendali Atribut Dalam Mengidentifikasi Kerusakan Pada Produk Tepung Tapioka Pt. Umas Jaya Agrotama LampungJurnal Rekayasa, Teknologi, dan Sains2(1).

Prasetyo, Y. E. (2012). Peran Pengendalian Kualitas Produk Gula pada PG. Tasikmadu Karanganyar dengan Menggunakan Metode P-Chart.

R Core Team. (2023). qcc: Quality Control Charts. Diakses pada 28 November 2024, dari https://cran.r-project.org/web/packages/qcc/index.html

Rusgiyono, A. (2009). Penerapan Grafik Pengendalian Demerit Terhadap Data KualitatatifMedia Statistika2(1), 49-56.

Demikian penjelasan mengenai Tutorial Grafik C: Pengendalian Atribut. Jika masih ada hal-hal yang membingungkan, jangan ragu untuk menuliskannya di kolom komentar atau menghubungi admin melalui tombol bantuan di kanan bawah. Jangan lupa untuk terus mengikuti website kami di exsight.id/blog agar tidak ketinggalan artikel-artikel menarik lainnya!

Tutorial Grafik C: Pengendalian Atribut Read More »

Hubungi Admin
Halo, selamat datang di Exsight! 👋

Hari ini kita ada DISKON 20% untuk semua transaksi. Klaim sekarang!