ALGORITMA METODE K-MEANS CLUSTERING - BAGIAN 3

Proses Clustering Menggunakan Algoritma K-Means

Download Jurnal di sini
https://jurnal.stmikroyal.ac.id/index.php/jurteksi/article/view/352
 
Data sampel yang telah mengalami transformasi data pada Tabel sebelumnya (Bagian 2) selanjutnya akan diolah dengan menggunakan metode K-Means Clustering agar mendapatkan hasil berupa pengelompokan data yang diharapkan sebelumnya. Algoritma yang terdapat pada K-Means adalah sebagai berikut:


1. Menentukan Jumlah Cluster
Jumlah cluster atau kelompok pada pengolahan data jamaah umroh diberikan sebanyak tiga cluster yaitu Sangat Diminati, Diminati dan Kurang Diminati.


2. Menentukan Centroid
Penentuan pusat awal cluster (centroid) ditentukan secara random atau acak yang diambil dari data yang ada. 
  • Nilai centroid pertama diambil dari Tabel Hasil Transformasi tepatnya baris ke-13, 
  • Nilai centroid kedua baris ke-16 dan 
  • Nilai centroid terakhir baris ke-25.  

Centroid Awal
NO.
NAMA
JENIS KELAMIN
USIA
PAKET
13
NEZA APRIDILLA
0
2
2
16
ROSDIANA MUCHTARAM NASUTION
0
8
2
25
ZULIJAWATI NGATIMAN MIKAR
0
6
2

3. Menghitung Jarak Minimum dari Dataset dengan Centroid
Formula yang dipakai untuk menghitung jarak antara titik centroid dengan titik tiap objek yaitu menggunakan Euclidean Distance. 

Berikut ini adalah proses perhitungan jarak minimum dataset dengan titik cluster dimulai dari:
  • Data sampel baris ke-1 atas nama Abdul Halim Muhammad Nuh dihitung dengan titik centroid ke-1 sebagai DC1, centroid ke-2 sebagai DC2 dan centroid ke-3 sebagai DC3, di mana:

Jadi, nilai terkecil baris ke-1 terdapat pada DC2 maka data jamaah baris ke-1 ditempatkan pada kelompok C2.

  • Data sampel baris ke-2 atas nama Armiyanti Ansari Itam dihitung dengan titik centroid ke-1 sebagai DC1, centroid ke-2 sebagai DC2 dan centroid ke-3 sebagai DC3, di mana:
rumus k-means clustering
Jadi, nilai terkecil pada baris ke-2 terdapat pada DC3 maka data jamaah  baris ke-2 ditempatkan pada kelompok C3.

  • Data sampel baris ke-3 atas nama Enny Halawati dihitung dengan titik centroid ke-1 sebagai DC1, centroid ke-2 sebagai DC2 dan centroid ke-3 sebagai DC3, di mana:

Jadi, nilai terkecil pada baris ke-3 terdapat pada DC3 maka data jamaah  baris ke-3 ditempatkan pada kelompok C3.
Perhitungan dilanjutkan sampai baris data ke-26 dan mendapatkan hasil penempatan anggota cluster berdasarkan kelompok. Hasil pengelompokan disajikan ke dalam bentuk tabel yang dapat dilihat pada Tabel berikut ini:
Hasil Perhitungan Jarak dan Pengelompokan Pada Iterasi Ke-1

NO
NAMA
DC1
DC2
DC3
C1
C2
C3
1
ABDUL HALIM MUHAMMAD NUH
6.164414003
1.414213562
2.449489743

1

2
ARMIYANTI ANSARI ITAM
4.123105626
2.236067977
1


1
3
ENNY HALAWATI
4.123105626
2.236067977
1


1
4
ERFINA LEGIMIN YOSO
4.123105626
2.236067977
1


1
5
HENNY SYARIF MUHAMMAD
5
1
1

1

6
LOKOT UDIN PANJAITAN
6.164414003
1.414213562
2.449489743

1

7
MAIMUNAH ABDUL MUNIR SAINAL
6.08276253
1
2.236067977

1

8
MARTINI DARMAJI SENGUT
6.08276253
1
2.236067977

1

9
MASNUN MUSA HASIBUAN
5
1
1

1

10
MISRAN RASUL HASAN
4.123105626
2.236067977
1


1
11
MUHAMMAD JUNAIDI SADINO
6.164414003
1.414213562
2.449489743

1

12
NANING WINARSIH SUTARNO
3.16227766
3.16227766
1.414213562


1
13
NEZA APRIDILLA
0
6
4
1


14
PONI WIRYO SUMARTO
6.08276253
1
2.236067977

1

15
RITAWATI NASIB GURUSINGA
5
1
1

1

16
ROSDIANA MUCHTARAM NASUTION
6
0
2

1

17
ROSLAINI ISMAIL FIRMAN
6.08276253
1
2.236067977

1

18
SUHARTINI LASIMIN KROMO
6.08276253
1
2.236067977

1

19
SUMARNI SUMARTO ABDULLAH
6
0
2

1

20
SUNARMI OSERI ABDULLAH
5.099019514
1.414213562
1.414213562

1

21
SUSILAWATI HUSIN TUMAN
4
2
0


1
22
TAING MUHAMMAD SARI SITOMPUL
5.099019514
1.414213562
1.414213562

1

23
TODUH KETEK ABDULLAH
5
1
1

1

24
ZAHIR NAUFAL AR RAZAQ
1.414213562
6.164414003
4.242640687
1


25
ZULIJAWATI NGATIMAN MIKAR
4
2
0


1
26
ZULISMAR SRI HARTATI
4.123105626
2.236067977
1


1

Di mana:
DC1 = Data hasil perhitungan jarak minimum dari dataset ke Centroid 1
DC2 = Data hasil perhitungan jarak minimum dari dataset ke Centroid 2
DC3 = Data hasil perhitungan jarak minimum dari dataset ke Centroid 3

4. Mengelompokkan objek untuk menentukan anggota cluster dengan menghitungkan jarak minimum objek ke pusat cluster. Perhitungan dilakukan sampai data ke-26 terhadap pusat cluster dengan memberikan kode “1” jika hasil cluster mendekati nol.

Setelah dilakukan perhitungan jarak dan pengelompokan data pada Tabel (Hasil Perhitungan Jarak dan Pengelompokan Pada Iterasi Ke-1) maka didapatkan anggota cluster baru di mana,

  • C1 memiliki 2 anggota, yaitu: 
Anggota Cluster 1 Pada Iterasi  Ke-1
No.
NAMA
JENIS KELAMIN
USIA
PAKET
1
NEZA APRIDILLA
0
2
2
2
ZAHIR NAUFAL AR RAZAQ
1
2
1
  • C2 memiliki 16 anggota, yaitu:
Anggota Cluster 2 Pada Iterasi  Ke-1
No.
NAMA
JENIS KELAMIN
USIA
PAKET
1
ABDUL HALIM MUHAMMAD NUH
1
8
1
2
HENNY SYARIF MUHAMMAD
0
7
2
3
LOKOT UDIN PANJAITAN
1
8
1
4
MAIMUNAH ABDUL MUNIR SAINAL
0
8
3
5
MARTINI DARMAJI SENGUT
0
8
1
6
MASNUN MUSA HASIBUAN
0
7
2
7
MUHAMMAD JUNAIDI SADINO
1
8
1
8
PONI WIRYO SUMARTO
0
8
3
9
RITAWATI NASIB GURUSINGA
0
7
2
10
ROSDIANA MUCHTARAM NASUTION
0
8
2
11
ROSLAINI ISMAIL FIRMAN
0
8
1
12
SUHARTINI LASIMIN KROMO
0
8
1
13
SUMARNI SUMARTO ABDULLAH
0
8
2
14
SUNARMI OSERI ABDULLAH
0
7
3
15
TAING MUHAMMAD SARI SITOMPUL
0
7
1
16
TODUH KETEK ABDULLAH
0
7
2
  • C3 memiliki 8 anggota, yaitu:
Anggota Cluster 3 Pada Iterasi  Ke-1
No.
NAMA
JENIS KELAMIN
USIA
PAKET
1
ARMIYANTI ANSARI ITAM
0
6
1
2
ENNY HALAWATI
0
6
1
3
ERFINA LEGIMIN YOSO
0
6
1
4
MISRAN RASUL HASAN
1
6
2
5
NANING WINARSIH SUTARNO
0
5
3
6
SUSILAWATI HUSIN TUMAN
0
6
2
7
ZULIJAWATI NGATIMAN MIKAR
0
6
2
8
ZULISMAR SRI HARTATI
0
6
1
5. Lakukan iterasi untuk melihat apakah jumlah anggota cluster berpindah tempat atau tetap. Jika diiterasi kedua anggota cluster tidak berpindah tempat maka iterasi dihentikan dan anggota tiap cluster telah ditetapkan. Iterasi kedua dilakukan dengan cara menentukan nilai centroid baru dari hasil rata-rata anggota cluster yang berada pada anggota cluster yang sama.


Dari hasil rata-rata di atas didapatkan nilai pusat cluster baru yang ditampilkan dalam bentuk Tabel berikut:  


Nilai Centroid Baru Untuk Iterasi Ke-2
CLUSTER
NILAI CENTROID BARU
C1
0.5
2
1.5
C2
0.1875
7.625
1.75
C3
0.125
5.875
1.625