Banyak orang mengenalnya dengan nama KDD, singkatan dari Knowledge Discovery in Databases.
Namun saat ini kepanjangan KDD mulai berubah menjadi Knowledge Discovery from Data. Kenapa? karena titik fokusnya bukan lagi hanya pada database, melainkan juga pada jenis-jenis data yang lain seperti WWW (world-wide-web), data stream, text/document.
Beberapa orang menyamakan data mining dengan nama KDD, namun hal ini kurang tepat karena sebenarnya data mining merupakan bagian data proses KDD.
KDD adalah rangkaian proses mengubah data “mentah” menjadi pengetahuan.
Berikut ini adalah tahapan-tahapan proses KDD :

  1. Data preprocessing (termasuk di dalamnya data cleaning, data integration, data selection, dan data transformation)
  2. Data preprocessing mengubah data “mentah” menjadi bentuk format yang sesuai untuk proses mining. Selain itu, pada data preprocessing dilakukan juga “pembersihan” data untuk data-data yang termasuk noise, yang tidak valid.

  3. Data mining & Pattern Evaluation
  4. Pada bagian ini baru dilakukan proses mining yang meng-“ekstraksi” pengetahuan dari data-data tersebut. Tidak semua pola-pola yang dihasilkan menarik/berguna. Pattern evaluation mengevaluasi hasil mining berdasarkan ukuran tertentu, tergantung proses mining yang dilakukan.

  5. Knowledge Representation
  6. Knowledge representation berusaha merepresentasikan pengetahuan yang diperoleh menjadi bentuk yang dapat dipahami oleh user.

Terlepas dari masalah nama, baik KDD maupun Data mining melibatkan banyak sekali disiplin ilmu yang lain. Misalnya : statistik, kecerdasan buatan (AI), database, teknik visualisasi. Belum lagi karena adanya berbagai jenis data yang mulai dieksplorasi untuk dimining, misalnya teori graph karena adanya graph mining, dan computational biology karena adanya mining pada bioinformatika. Semakin banyak disiplin ilmu yang bersinggungan dengan data mining.