Proses Clustering Menggunakan Algoritma K-Means
Download Jurnal di sini
https://jurnal.stmikroyal.ac.id/index.php/jurteksi/article/view/352
Data sampel yang telah mengalami transformasi data pada Tabel sebelumnya (Bagian 2) selanjutnya akan diolah dengan menggunakan metode K-Means Clustering agar mendapatkan hasil berupa pengelompokan data yang diharapkan sebelumnya. Algoritma yang terdapat pada K-Means adalah sebagai berikut:
https://jurnal.stmikroyal.ac.id/index.php/jurteksi/article/view/352
Data sampel yang telah mengalami transformasi data pada Tabel sebelumnya (Bagian 2) selanjutnya akan diolah dengan menggunakan metode K-Means Clustering agar mendapatkan hasil berupa pengelompokan data yang diharapkan sebelumnya. Algoritma yang terdapat pada K-Means adalah sebagai berikut:
Jumlah cluster atau kelompok pada pengolahan data jamaah umroh diberikan sebanyak tiga cluster yaitu Sangat Diminati, Diminati dan Kurang Diminati.
2. Menentukan Centroid
Penentuan pusat awal cluster (centroid) ditentukan secara random atau acak yang diambil dari data yang ada.
- Nilai centroid pertama diambil dari Tabel Hasil Transformasi tepatnya baris ke-13,
- Nilai centroid kedua baris ke-16 dan
- Nilai centroid terakhir baris ke-25.
Centroid Awal
NO.
|
NAMA
|
JENIS KELAMIN
|
USIA
|
PAKET
|
13
|
NEZA
APRIDILLA
|
0
|
2
|
2
|
16
|
ROSDIANA
MUCHTARAM NASUTION
|
0
|
8
|
2
|
25
|
ZULIJAWATI
NGATIMAN MIKAR
|
0
|
6
|
2
|
3. Menghitung Jarak Minimum dari Dataset dengan Centroid
Formula yang dipakai untuk menghitung jarak antara titik centroid dengan titik tiap objek yaitu menggunakan Euclidean Distance.
Berikut ini adalah proses perhitungan jarak minimum dataset dengan titik cluster dimulai dari:
- Data sampel baris ke-1 atas nama Abdul Halim Muhammad Nuh dihitung dengan titik centroid ke-1 sebagai DC1, centroid ke-2 sebagai DC2 dan centroid ke-3 sebagai DC3, di mana:
Jadi, nilai terkecil baris ke-1 terdapat pada DC2 maka data jamaah baris ke-1 ditempatkan pada kelompok C2.
- Data sampel baris ke-2 atas nama Armiyanti Ansari Itam dihitung dengan titik centroid ke-1 sebagai DC1, centroid ke-2 sebagai DC2 dan centroid ke-3 sebagai DC3, di mana:
Jadi, nilai terkecil pada baris ke-2 terdapat pada DC3 maka data jamaah baris ke-2 ditempatkan pada kelompok C3.
- Data sampel baris ke-3 atas nama Enny Halawati dihitung dengan titik centroid ke-1 sebagai DC1, centroid ke-2 sebagai DC2 dan centroid ke-3 sebagai DC3, di mana:
Jadi, nilai terkecil pada baris ke-3 terdapat pada DC3 maka data jamaah baris ke-3 ditempatkan pada kelompok C3.Perhitungan dilanjutkan sampai baris data ke-26 dan mendapatkan hasil penempatan anggota cluster berdasarkan kelompok. Hasil pengelompokan disajikan ke dalam bentuk tabel yang dapat dilihat pada Tabel berikut ini:
Hasil Perhitungan Jarak dan Pengelompokan Pada Iterasi Ke-1
NO
|
NAMA
|
DC1
|
DC2
|
DC3
|
C1
|
C2
|
C3
|
1
|
ABDUL HALIM
MUHAMMAD NUH
|
6.164414003
|
1.414213562
|
2.449489743
|
1
|
||
2
|
ARMIYANTI
ANSARI ITAM
|
4.123105626
|
2.236067977
|
1
|
1
|
||
3
|
ENNY HALAWATI
|
4.123105626
|
2.236067977
|
1
|
1
|
||
4
|
ERFINA LEGIMIN
YOSO
|
4.123105626
|
2.236067977
|
1
|
1
|
||
5
|
HENNY SYARIF
MUHAMMAD
|
5
|
1
|
1
|
1
|
||
6
|
LOKOT UDIN
PANJAITAN
|
6.164414003
|
1.414213562
|
2.449489743
|
1
|
||
7
|
MAIMUNAH ABDUL
MUNIR SAINAL
|
6.08276253
|
1
|
2.236067977
|
1
|
||
8
|
MARTINI
DARMAJI SENGUT
|
6.08276253
|
1
|
2.236067977
|
1
|
||
9
|
MASNUN MUSA
HASIBUAN
|
5
|
1
|
1
|
1
|
||
10
|
MISRAN RASUL
HASAN
|
4.123105626
|
2.236067977
|
1
|
1
|
||
11
|
MUHAMMAD
JUNAIDI SADINO
|
6.164414003
|
1.414213562
|
2.449489743
|
1
|
||
12
|
NANING
WINARSIH SUTARNO
|
3.16227766
|
3.16227766
|
1.414213562
|
1
|
||
13
|
NEZA APRIDILLA
|
0
|
6
|
4
|
1
|
||
14
|
PONI WIRYO
SUMARTO
|
6.08276253
|
1
|
2.236067977
|
1
|
||
15
|
RITAWATI NASIB
GURUSINGA
|
5
|
1
|
1
|
1
|
||
16
|
ROSDIANA
MUCHTARAM NASUTION
|
6
|
0
|
2
|
1
|
||
17
|
ROSLAINI
ISMAIL FIRMAN
|
6.08276253
|
1
|
2.236067977
|
1
|
||
18
|
SUHARTINI
LASIMIN KROMO
|
6.08276253
|
1
|
2.236067977
|
1
|
||
19
|
SUMARNI
SUMARTO ABDULLAH
|
6
|
0
|
2
|
1
|
||
20
|
SUNARMI OSERI
ABDULLAH
|
5.099019514
|
1.414213562
|
1.414213562
|
1
|
||
21
|
SUSILAWATI
HUSIN TUMAN
|
4
|
2
|
0
|
1
|
||
22
|
TAING MUHAMMAD
SARI SITOMPUL
|
5.099019514
|
1.414213562
|
1.414213562
|
1
|
||
23
|
TODUH KETEK
ABDULLAH
|
5
|
1
|
1
|
1
|
||
24
|
ZAHIR NAUFAL
AR RAZAQ
|
1.414213562
|
6.164414003
|
4.242640687
|
1
|
||
25
|
ZULIJAWATI
NGATIMAN MIKAR
|
4
|
2
|
0
|
1
|
||
26
|
ZULISMAR SRI
HARTATI
|
4.123105626
|
2.236067977
|
1
|
1
|
Di mana:
DC1 = Data hasil perhitungan jarak minimum dari dataset ke Centroid 1
DC2 = Data hasil perhitungan jarak minimum dari dataset ke Centroid 2
DC3 = Data hasil perhitungan jarak minimum dari dataset ke Centroid 3
Setelah dilakukan perhitungan jarak dan pengelompokan data pada Tabel (Hasil Perhitungan Jarak dan Pengelompokan Pada Iterasi Ke-1) maka didapatkan anggota cluster baru di mana,
- C1 memiliki 2 anggota, yaitu:
Anggota Cluster
1 Pada Iterasi Ke-1
No.
|
NAMA
|
JENIS KELAMIN
|
USIA
|
PAKET
|
1
|
NEZA APRIDILLA
|
0
|
2
|
2
|
2
|
ZAHIR NAUFAL
AR RAZAQ
|
1
|
2
|
1
|
- C2 memiliki 16 anggota, yaitu:
Anggota Cluster
2 Pada Iterasi Ke-1
No.
|
NAMA
|
JENIS KELAMIN
|
USIA
|
PAKET
|
1
|
ABDUL HALIM
MUHAMMAD NUH
|
1
|
8
|
1
|
2
|
HENNY SYARIF
MUHAMMAD
|
0
|
7
|
2
|
3
|
LOKOT UDIN
PANJAITAN
|
1
|
8
|
1
|
4
|
MAIMUNAH ABDUL
MUNIR SAINAL
|
0
|
8
|
3
|
5
|
MARTINI
DARMAJI SENGUT
|
0
|
8
|
1
|
6
|
MASNUN MUSA
HASIBUAN
|
0
|
7
|
2
|
7
|
MUHAMMAD
JUNAIDI SADINO
|
1
|
8
|
1
|
8
|
PONI WIRYO
SUMARTO
|
0
|
8
|
3
|
9
|
RITAWATI NASIB
GURUSINGA
|
0
|
7
|
2
|
10
|
ROSDIANA
MUCHTARAM NASUTION
|
0
|
8
|
2
|
11
|
ROSLAINI
ISMAIL FIRMAN
|
0
|
8
|
1
|
12
|
SUHARTINI
LASIMIN KROMO
|
0
|
8
|
1
|
13
|
SUMARNI
SUMARTO ABDULLAH
|
0
|
8
|
2
|
14
|
SUNARMI OSERI
ABDULLAH
|
0
|
7
|
3
|
15
|
TAING MUHAMMAD
SARI SITOMPUL
|
0
|
7
|
1
|
16
|
TODUH KETEK
ABDULLAH
|
0
|
7
|
2
|
- C3 memiliki 8 anggota, yaitu:
Anggota Cluster
3 Pada Iterasi Ke-1
No.
|
NAMA
|
JENIS KELAMIN
|
USIA
|
PAKET
|
1
|
ARMIYANTI
ANSARI ITAM
|
0
|
6
|
1
|
2
|
ENNY HALAWATI
|
0
|
6
|
1
|
3
|
ERFINA LEGIMIN
YOSO
|
0
|
6
|
1
|
4
|
MISRAN RASUL
HASAN
|
1
|
6
|
2
|
5
|
NANING
WINARSIH SUTARNO
|
0
|
5
|
3
|
6
|
SUSILAWATI
HUSIN TUMAN
|
0
|
6
|
2
|
7
|
ZULIJAWATI
NGATIMAN MIKAR
|
0
|
6
|
2
|
8
|
ZULISMAR SRI
HARTATI
|
0
|
6
|
1
|
5. Lakukan iterasi untuk melihat apakah jumlah anggota cluster berpindah tempat atau tetap. Jika diiterasi kedua anggota cluster tidak berpindah tempat maka iterasi dihentikan dan anggota tiap cluster telah ditetapkan. Iterasi kedua dilakukan dengan cara menentukan nilai centroid baru dari hasil rata-rata anggota cluster yang berada pada anggota cluster yang sama.
Dari hasil rata-rata di atas didapatkan nilai pusat cluster baru yang ditampilkan dalam bentuk Tabel berikut:
Nilai
Centroid Baru Untuk Iterasi Ke-2
CLUSTER
|
NILAI CENTROID BARU
|
||
C1
|
0.5
|
2
|
1.5
|
C2
|
0.1875
|
7.625
|
1.75
|
C3
|
0.125
|
5.875
|
1.625
|