Data mining merupakan sebuah analisis dari observasi data dalam jumlah besar untuk menemukan hubungan yang tidak diketahui sebelumnya dan metode baru untuk meringkas data agar mudah dipahami serta kegunaannya untuk pemilik data, sebagai satu set teknik yang digunakan secara otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaaan relasi-relasi yang kompleks pada set data yang sangat besar (Hand, 2001:1)
Data Mining menggunakan pendekatan berbasis penemuan dimana pencocokan pola dan algoritma-algoritma tertentu digunakan untuk menentukan relasi-relasi kunci di dalam data yang dieksplorasi.
Data Mining menggunakan pendekatan berbasis penemuan dimana pencocokan pola dan algoritma-algoritma tertentu digunakan untuk menentukan relasi-relasi kunci di dalam data yang dieksplorasi.
Tahap Pemrosesan Data Mining
Salah satu tuntutan dari data mining ketika diterapkan pada data berskala besar adalah dibutuhkan metodologi sistematis tidak hanya ketika melakukan analisis tetapi juga di saat mempersiapkan data dan melakukan interpretasi dari hasilnya sehingga dapat menjadi aksi ataupun keputusan yang bermanfaat. Pada gambar ditunjukkan tahapan dari proses data mining dimulai dari Seleksi, Praproses, Transformasi, Data Mining dan Interpretasi / Evaluasi.
![]() | ||
| Proses Data Mining (Usama Fayyad) |
- Seleksi
Pemilihan seleksi data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam data mining dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining disimpan dalam satu berkas, terpisah dari basis data operasional.
Pemilihan seleksi data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam data mining dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining disimpan dalam satu berkas, terpisah dari basis data operasional.
