Pengertian
- Data mining merupakan proses berulang-ulang, di manapenyelesaian didefinisikan olehpenemuan, baik secara otomatisatau metode manual.(Kantardzic, 2003)
- Data mining (DM) adalah ekstraksi dari suatu informasi yang manarik atau berguna dari database besar (DB). Dengan pencarian otomatispengetahuan implisit dalam DBs, menggunakan DM analisis statistik canggih dan teknik pemodelan untuk menemukan pola dan hubungantersembunyi dalam organisasi DBs (Wang, 2003)
- Data mining merujuk pada ekstraksi atau \ pertambangan "pengetahuan dari data dalam jumlah besar (Han, 2005)
- Non-trivial ekstraksi implisit, yang sebelumnya tidak dikenal dan berpotensimenjadi informasi yang berguna dari data (Tan, 2003)
A. Metode Prediksi
Dengan menggunakan beberapa variabel untuk memprediksi nilai yang belum diketahui (unknown) atau nilai selanjutnya (future) atau variabel lain.
Contoh :
1. Classification
- Pada persoalan klasifikasi, kita memiliki sejumlah kasus (sampel data) dan ingin mempresiksi beberapa class yang ada pada sampel data tersebut.
- Tiap isntan data berisi banyak atribut, dimana masing-masing atribut memiliki satu dari beberapa kemungkinan nilai.
- Hanya satu atribut diantara banyak aribut tersebut yang disebut atribut target, sedangkan atribut yang lain disebut sebagai atribut prediktor.
3. Deviation Detection
B. Metode DeskripsiMenemukan pola pendeskripsian data yang dapat diinterpretasikan oleh manusia.
Contoh :
1. Clustering
- Teknik yang berguna untuk mengeksplorasi data
- digunakan pada saat banyak kasus dan tidak memiliki pengelompokan secara alami. (Dalam hal ini algoritma data mining dapat digunakan untuk mencari pengelompokan yang ada pada peta).
- Clustering model berbeda dari model prediktif dikarenakan pada clustering tidak perlu ada atribut target.
- Clustering juga dapat diorganisasi ke dalam sturktur hirarkikal akan mendefinisikan taksonomi dari data.
- Sering disebut "Market Basket Analysis" yang digunakan untk menemukan relasi atau korelasi diantara himpunan item-item.
- Fungsi ini paling banyak digunakan untuk menganalisa data dalam rangka keperluan strategi pemasaran, desain katalog, dan proses pembuatan keputusan bisnis.
- Bisa dinyatakan sebagai, misal : "70 % dari orang-orang yang memebeli mie, juice dan saus akan membeli juga roti tawar."
Sumberhttp://funpreuner.blogspot.com/2011/02/pertemuan-1-pengertian-dan-macam-macam.html
0 komentar:
Posting Komentar