Knowledge Discovery in Database (KDD) adalah keseluruhan proses untuk mengkonversi data mentah menjadi suatu pengetahuan yang bermanfaat (Rosadi dkk, 2016). Knowledge Discovery in Database didefinisikan sebagai ekstraksi informasi potensial, implisit dan tidak dikenal dari sekumpulan data. Data dalam bentuk mentah hanya kumpulan elemen dari yang sedikit pengetahuan bisa dipetik. Proses knowledge discovery melibatkan hasil dari proses Data Mining (proses mengekstrak kecenderungan pola suatu data), kemudian mengubah hasilnya secara akurat menjadi informasi yang mudah dipahami (Musharyadi, 2017).
Istilah Data Mining dan KDD seringkali digunakan secara bergantian untuk menjelaskan proses penggalian informasi tersembunyi dalam suatu basis data yang besar. Sebenarnya kedua istilah tersebut memiliki konsep yang berbeda, tetapi berkaitan satu sama lain dan salah satu tahapan dalam keseluruhan proses KDD adalah Data Mining (Nuryaman dkk, 2018). Proses Knowledge Discovery In Database (KDD) secara garis besar meliputi kegiatan Data Selection, Pre-processing/Cleaning, Tranformation Data, Data Mining, dan Interpretation/Evaluation.
KDD merupakan proses mengekstrak pola atau model dari data dengan menggunakan suatu algoritma yang spesifik. Adapun proses KDD sebagai berikut (Kurniawansyah, 2018):
1. Data Selection
Data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses Data Mining disimpan dalam suatu berkas, terpisah dari basis data operasional (Musharyadi, 2017).
2. Pre-processing
Sebelum Data Mining dapat dilaksanakan, perlu dilakukan proses cleaning duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi). Juga dilakukan enrichment data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal.3. Transformation
Merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam database.4. Data Mining
Sebagai rangkaian kegiatan untuk menemukan pola yang menarik dari data dalam jumlah besar, kemudian data-data tersebut dapat disimpan dalam database, data warehouse atau penyimpanan informasi.5. Interpretation / Evalution
Data Mining ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD interpretation mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya atau tidak.
Singkatnya, Data Mining itu berbeda dengan KDD, dimana Data Mining merupakan bagian dari KDD. Walaupun banyaknya pemahaman diluar sana mengatakan data mining itu sama dengan KDD. Semoga bermanfaat! Terima Kasih