Cara mencari Dataset lengkap sekut!
Mencari DataSet Pada UCI Machine Learning
TAHAP 1 :
Kemudian akan muncul tampilan seperti di bawah ini :
Uci Machine Learning Repository adalah kumpulan basis data, teori domain, dan generator data yang digunakan oleh komunitas pembelajaran mesin untuk analisis empiris algoritma pembelajaran mesin. Dibuat sebagai arsip ftp pada tahun 1987 oleh David Aha dan sesama mahasiswa pascasarjana di UC Irvine.
TAHAP 2 :
Klik “VIEW ALL DataSets” pada pojok kanan atas.Seperti gambar di bawah ini :
TAHAP 3 :
Pilih Data yang ingin dianalisis, disini saya memilih Data tentang "Car Evaluation DataSet"
TAHAP 4 :
Pada gambar di bawah, terdapat tabel yang menjelaskan tentang:
- Jenis DataSet,yaitu Multivariate.
Analisis statistik multivariate merupakan metode statistik yang memungkinkan kita melakukan penelitian terhadap lebih dari dua variable secara bersamaan. Dengan menggunakan teknik analisis ini maka kita dapat menganalisis pengaruh beberapa variable terhadap variabel – (variable) lainnya dalam waktu yang bersamaan.Contohnya pada dataset yang saya ambil.
Analisis multivariate digunakan karena pada kenyataannnya masalah yang terjadi tidak dapat diselesaikan dengan hanya menghubung-hubungkan dua variable atau melihat pengaruh satu variable terhadap variable lainnya.
- Jenis Atribut Data,yaitu Nominal
Nominal berarti "yang berkaitan dengan nama-nama." Nilai-nilai atribut nominal adalah simbol atau nama-nama dari suatu benda. Setiap nilai merupakan semacam kategori, kode, atau status dan sebagainya sehingga atribut nominal juga disebut sebagai kategorikal. Nilai-nilai di dalamnya tidak memiliki urutan. Dalam ilmu komputer, nilai-nilai tersebut disebut juga dengan enumerasi.
- Jenis Karakteristik, yaitu Clasification
Clasification merupakan suatu proses untuk menemukan model atau fungsi untuk menggambarkan class atau konsep dari suatu data. Proses yang digunakan untuk mendeskripsikan data yang penting serta dapat meramalkan kecenderungan data pada masa depan.
Pencipta:
Marko Bohanec
Donatur:
1. Marko Bohanec (marko.bohanec '@' ijs.si)
2. Blaz Zupan (blaz.zupan '@' ijs.si)
Informasi Kumpulan Data:
Database Evaluasi Mobil berasal dari model keputusan hierarkis sederhana yang awalnya dikembangkan untuk demonstrasi DEX, M. Bohanec, V. Rajkovic: Sistem pakar untuk pengambilan keputusan. Sistemica 1 (1), hlm. 145-157, 1990.). Model mengevaluasi mobil sesuai dengan struktur konsep berikut:
Penerimaan mobil CAR
. HARGA harga keseluruhan
. . beli harga beli
. . mempertahankan harga perawatan
. Karakteristik teknis TECH
. . Kenyamanan NYAMAN
. . . pintu-pintu sejumlah pintu
. . . kapasitas orang dalam hal orang untuk dibawa
. . . lug_boot ukuran boot bagasi
. . keselamatan diperkirakan keselamatan mobil
Atribut input dicetak dalam huruf kecil. Selain konsep target (CAR), model ini mencakup tiga konsep perantara: PRICE, TECH, COMFORT. Setiap konsep ada dalam model asli yang terkait dengan keturunan tingkat bawah oleh serangkaian contoh (untuk contoh-contoh ini lihat [Tautan Web]).Basis Data Evaluasi Mobil berisi contoh-contoh dengan informasi struktural dihapus, mis., Secara langsung menghubungkan CAR dengan enam atribut input: membeli, memelihara, pintu, orang, lug_boot, keselamatan.Karena struktur konsep dasar yang diketahui, basis data ini mungkin sangat berguna untuk menguji induksi konstruktif dan metode penemuan struktur.
TAHAP 5:
Untuk menganalisis dataset, klik link DataFolder seperti gambar di bawah ini:
Kemudian download file dengan ekstensi .data dan .names yang ada di dalamnya.
TAHAP 6:
Buka lokasi file yang telah di download, kemudian klik kanan pada ekstensi .data dan rename file tersebut dan ganti ekstensinya menjadi .csv.
Buka dengan file excel,maka tampilannya akan seperti di bawah ini.
TAHAP 7:
Untuk melihat deskripsi dari dataset tersebut, dapat dilihat pada file dengan ekstensi .names
Informasi Atribut:
Atribut:
buying: vhigh, tinggi, med, rendah.
Maint: vhigh, tinggi, med, rendah.
doors: 2, 3, 4, 5 lagi.
person: 2, 4, lebih banyak.
lug_boot: kecil, med, besar.
safety: rendah, med, tinggi.
Komenta