DATA MINING ?

Data Mining menurut beberapa ahli :
Menurut Pramudiono:
Data Mining adalah analisis otomatis dari data yang berjumlah besar atau kompleks dengan tujuan untuk menemukan pola atau kecenderungan yang penting yang biasanya tidak disadari keberadaanya. (Pramudiono,2006)
Menurut Larose:
Data Mining merupakan analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkasdata dengan cara berbeda dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik data. (Larose, 2005)
Data Mining merupakan bidang dari beberapa bidang keilmuan yang menyatukan teknik dari pembelajaran mesin, pengenalan pola, statistic,database, dan visualisasi untuk penanganan permasalahan pengambilan informasi dari database yang besar.(Larose, 2005)
Mengapa kita perlu memahami Data Mining? Karena manusia menghasilkan banyak sekali Data yang sangat besar baik dalam bidang Bisnis, Kedokteran, Cuaca, Olahraga, Politik dan sebagainya.
Kita mengetahui bahwa setiap proses terdiri dari 3 (tiga) fase yaitu :

INPUT -> PROSES -> OUTPUT

Dari gambar di atas bahwa mengetahui suatu hal itu dapat diselesaikan dimulai dengan sebuah Inputan (data) kemudian di Proses sehingga menghasilkan sebuah keluaran. Tentunya di dalam data mining juga mengalami fase tersebut. Yangmembedakannya adalah pada Data Mining yang menjadi Input adalah Himpunan Data, Prosesnya adalah Algoritma atau metode dalam Data Mining itu sendiri, dan Keluarannya adalah berupa Pengetahuan dalam bentuk Pola, Decision Tree, Cluster dan lain-lain.Untuk lebih jelasnya dapat dilihat dari penjelasan di bawah ini :


1. Gold Mining
Gambar Tersebut diatas menjelaskan tentang beberapa orang  sedang mencari dan melakukan penambangan emas. Jadi dalam hal ini yang menjadi Input adalah Bukit Emas sedangkan proses yang K adalah Penambangan yang dimulai dengan Identifikasi titik pada Bukit Emas tersebut dimana Emas itu berada dan dilanjutkan dengan proses Penggalian sampai mendapatkan Emas sebagai Outputnya. 

2. Data Mining

Gambar tersebut di atas menjeleskan sebuah Himpunan Data yang menjadi Input kemudian dilakukan pencarian pengetahuan menggunakan Metode Data Mining sehingga pada akhirnya didapatkan Pengetahuan sebagai Output.

Berdasarkan proses di atas untuk menunjang pemahaman tentang Data Mining kita harus memahami beberapa disiplin ilmu lain seperti terlihat pada penjelasan di bawah ini:

1.Knowledge Discovery Database(KDD)
Pada proses Data Mining yang biasa disebut Knowledge Discovery Database(KDD) terdapat beberapa proses seperti terlihat pada gambar di bawah ini: 


Penjelasan gambar:
Pada proses Knowledge Discovery Database (KDD)terdapat beberapa fase yaitu sebagai berikut:
Pada proses Knowledge Discovery Database (KDD)terdapat beberapa fase yaitu sebagai
berikut:
1. Seleksi Data (Selection)
Selection (seleksi/pemilihan) data dari merupakan sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam Knowledge Discovery Database (KDD) dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional
2. Pemilihan Data (Preprocessing/Cleaning) Proses Preprocessingmencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi). Juga dilakukan proses enrichment, yaitu  proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal.
3. Transformasi (Transformation).Pada fase ini yang dilakukan adalah mentransformasi bentuk data yang belum memiliki entitas yang jelas kedalam bentuk data yang valid atau siap untuk dilakukan proses Data Mining.
4. Data Mining
Pada fase ini yang dilakukan adalah menerapkan algoritma atau metode pencarian pengetahuan.
5. Interpretasi/Evaluasi (Interpratation/Evaluation)
Pada fase terakhir ini yang dilakukan adalah proses pembentukan keluaran yang mudah dimengerti yang bersumber pada proses Data Mining Pola informasi.


Komenta

Komentar

Postingan populer dari blog ini

HIRARKI CHOMSKY

EKUIVALENSI ANTARA DFA

LKMM Pra-TD Teknik Informatika STT PLN JAKARTA