pengetahuan yang tersembunyi di dalam database.
Tugas data mining sebenarnya adalah analisis otomatis atau semiotomatis
jumlah besar data untuk mengekstrak pola yang menarik yang
sebelumnya tidak diketahui seperti kelompok catatan data (analisis
cluster), catatan yang tidak biasa (deteksi anomali) dan dependensi (aturan
asosiasi pertambangan). Hal ini biasanya melibatkan menggunakan teknik
database seperti indeks spasial.
Pola ini kemudian dapat dilihat sebagai semacam ringkasan dari input
data, dan dapat digunakan dalam analisis lebih lanjut atau, misalnya, dalam
pembelajaran mesin dan analisis prediktif. Misalnya, langkah data mining
mungkin mengidentifikasi beberapa kelompok dalam data, yang kemudian
dapat digunakan untuk memperoleh hasil prediksi yang lebih akurat oleh
sistem pendukung keputusan. Baik pengumpulan data, penyusunan data,
atau interpretasi hasil dan pelaporan merupakan bagian dari langkah data
mining, tetapi milik proses KDD secara keseluruhan sebagai langkahlangkah
tambahan.