1. Data Mining
Data mining
adalah proses menemukan pola yang rumit dan memunculkan pengetahuan dari
sejumlah besar data. Sumber data dapat mencakup basis data, data gudang, Web,
repositori informasi lain, atau data yang dialirkan ke Internet sistem secara
dinamis. [1]
Contoh : Educational Data Mining sebagai prediksi perilaku
belajar di masa depan siswa, mempelajari dampak dukungan pendidikan, dan
memajukan pengetahuan ilmiah tentang pembelajaran.
2. Classification
Klasifikasi
adalah proses menemukan model (atau fungsi) yang menggambarkan dan membedakan kelas
atau konsep data. Model diturunkan berdasarkan analisis satu set data
pelatihan. (contoh objek data yang label kelasnya diketahui). [1]
3. K‐Nearest Neighbour
Algoritma k-Nearest
Neighbor adalah algoritma supervised learning dimana hasil dari
instance yang baru diklasifikasikan berdasarkan mayoritas dari kategori
k-tetangga terdekat. Tujuan dari algoritma ini adalah untuk mengklasifikasikan
obyek baru berdasarkan atribut dan sample-sample dari training data. Algoritma k-Nearest
Neighbor menggunakan Neighborhood Classification sebagai nilai
prediksi dari nilai instance yang baru.[1]
4. Naive Bayes
Suatu model
klasifikasi yang memodelkan suatu data untuk menjadi suatu model berbentuk
probabilitas, dimana probabilitas setiap nilai variable target untuk satu set
veriabel yang diberikan untuk memprediksi peluang di masa depan berdasarkan
pengalaman di masa sebelumnya . [1]
5. Decision Tree
Decision Tree (Pohon keputusan) adalah metodologi klasifikasi, di mana proses
klasifikasi dimodelkan dengan penggunaan seperangkat keputusan hirarkis pada
variabel fitur, disusun dalam susunan pohon struktur. Keputusan pada simpul
pohon tertentu, yang disebut sebagai split Kriteria, biasanya suatu kondisi
pada satu atau lebih variabel fitur dalam data pelatihan. kriteria split
membagi data pelatihan menjadi dua bagian atau lebih. Contoh, pertimbangkan kasus
di mana Usia adalah atribut, dan kriteria pemisahan adalah Usia ≤ 30. Dalam hal
ini, kiri cabang pohon keputusan berisi semua contoh pelatihan dengan usia
paling banyak 30, sedangkan cabang kanan berisi semua contoh dengan usia lebih
dari 30. Tujuannya adalah untuk mengidentifikasi perpecahan kriteria sehingga
tingkat "pencampuran" variabel kelas di setiap cabang pohon adalah dikurangi
sebanyak mungkin. Setiap node di pohon keputusan secara logis mewakili subset
dari ruang data yang ditentukan oleh kombinasi kriteria split di node di
atasnya. [1]
6. Clustering
Clustering metode penganalisaan data, yang sering dimasukkan sebagai salah
satu metode Data Mining, yang tujuannya adalah untuk mengelompokkan data
dengan karakteristik yang sama ke suatu ‘wilayah’ yang sama dan data dengan
karakteristik yang berbeda ke ‘wilayah’ yang lain.
Contoh aplikasi yang relevan adalah sebagai berikut:
a). Segmentasi pelanggan: Dalam banyak aplikasi, diinginkan untuk
menentukan pelanggan yang mirip satu sama lain dalam konteks berbagai tugas
promosi produk. Fase segmentasi memainkan peran penting dalam proses ini.
b). Peringkasan data: Karena kelompok dapat dianggap kelompok
rekaman yang serupa, kelompok serupa ini dapat digunakan untuk membuat
ringkasan data.
b). Aplikasi untuk masalah penambangan data lainnya: Karena
pengelompokan dianggap sebagai tanpa pengawasan versi klasifikasi, sering
digunakan sebagai blok bangunan untuk menyelesaikan yang terakhir. Selain itu,
masalah ini juga digunakan dalam konteks masalah analisis pencilan, [1]
7. K‐Mean Cluster
K‐Mean Cluster adalah merupakan salah satu algoritma clustering
yang membagi data menjadi beberapa
kelompok. Algoritma ini menerima masukan berupa data tanpa label kelas. [1]
8. Estimation
Estimasi adalah
untuk menentukan nilai untuk atribut output yang tidak diketahui. Namun, tidak
seperti klasifikasi, atribut output untuk masalah estimasi adalah numerik
daripada kategorikal. [2]
Berikut adalah empat contoh tugas estimasi:
• Perkirakan jumlah menit sebelum badai akan mencapai lokasi
tertentu.
• Perkirakan pengembalian investasi untuk kampanye iklan.
• Perkirakan kemungkinan kartu kredit dicuri.
• Perkirakan panjang semburan sinar gamma.
9. Prediction
Model prediktif
adalah untuk menentukan hasil masa depan daripada perilaku saat ini. Atribut
keluaran model prediksi dapat berupa kategori atau numerik. Berikut adalah
beberapa contoh tugas yang sesuai untuk penambangan data prediktif:
• Prediksi jumlah total touchdown NFL yang akan mencetak skor
selama musim NFL 2017
• Tentukan
apakah pelanggan kartu kredit kemungkinan akan mengambil keuntungan dari penawaran
khusus yang disediakan dengan tagihan kartu kreditnya • Prediksi harga
penutupan minggu depan untuk Dow Jones Industrial Average
• Prakiraan
pelanggan seluler mana yang akan berganti penyedia selama tiga bulan ke depan Kebanyakan
teknik penambangan data yang diawasi sesuai untuk masalah klasifikasi atau
estimasi juga dapat membangun model prediksi. Sebenarnya, sifat data yang
menentukan apakah model cocok untuk klasifikasi, estimasi, atau prediksi. [2]
10. Association
Asosiasi
digunakan untuk menemukan hubungan yang menarik antara atribut yang terkandung
dalam database. Tidak seperti aturan produksi tradisional, aturan asosiasi
dapat memiliki satu atau beberapa atribut keluaran. Juga, atribut output untuk
satu aturan dapat menjadi atribut input untuk aturan lain. Aturan asosiasi
adalah teknik yang populer untuk analisis keranjang pasar karena semua
kemungkinan kombinasi dari pengelompokan produk yang berpotensi menarik dapat
dieksplorasi. Dengan kata lain merupakan teknik data mining untuk menemukan aturan
assosiatifantara suatu kombinasi item. [2]
11. Apriori
Algoritma Apriori menggunakan properti penutupan ke bawah untuk memangkas kandidat ruang pencarian. Properti penutupan ke bawah memaksakan struktur yang jelas pada set frekuensi pola. Secara khusus, informasi tentang jarangnya itemset dapat dimanfaatkan menghasilkan kandidat superset lebih hati-hati. Jadi, jika suatu set item jarang, ada tidak ada gunanya menghitung dukungan dari kandidat supersetnya. Ini berguna untuk menghindari penghitungan boros tingkat dukungan dari itemet yang diketahui tidak sering terjadi. Itu Algoritma Apriori menghasilkan kandidat dengan panjang k lebih kecil pertama dan menghitung dukungan mereka sebelum menghasilkan kandidat panjang (k +1). K-itemset yang dihasilkan sering digunakan untuk batasi jumlah (k + 1) -candidate dengan properti penutupan bawah. Kandidat generasi dan mendukung penghitungan pola dengan bertambahnya panjang disisipkan di Apriori. Karena penghitungan dukungan calon adalah bagian paling mahal dari yang sering proses pembuatan pola, sangat penting untuk menjaga jumlah kandidat tetap rendah.
Daftar Pustaka
[1] Aggarwal, Charu C. (2015), Data Mining (The Textbook), Switzerland : Springer International
Publishing Switzerland
0 Response to "Definisi terkait Cabang Ilmu AI"
Posting Komentar