Definisi terkait Cabang Ilmu AI

 

1. Data Mining

Data mining adalah proses menemukan pola yang rumit dan memunculkan pengetahuan dari sejumlah besar data. Sumber data dapat mencakup basis data, data gudang, Web, repositori informasi lain, atau data yang dialirkan ke Internet sistem secara dinamis. [1]

Contoh : Educational Data Mining sebagai prediksi perilaku belajar di masa depan siswa, mempelajari dampak dukungan pendidikan, dan memajukan pengetahuan ilmiah tentang pembelajaran.

2. Classification

Klasifikasi adalah proses menemukan model (atau fungsi) yang menggambarkan dan membedakan kelas atau konsep data. Model diturunkan berdasarkan analisis satu set data pelatihan. (contoh objek data yang label kelasnya diketahui). [1]

3. K‐Nearest Neighbour

Algoritma k-Nearest Neighbor adalah algoritma supervised learning dimana hasil dari instance yang baru diklasifikasikan berdasarkan mayoritas dari kategori k-tetangga terdekat. Tujuan dari algoritma ini adalah untuk mengklasifikasikan obyek baru berdasarkan atribut dan sample-sample dari training data. Algoritma k-Nearest Neighbor menggunakan Neighborhood Classification sebagai nilai prediksi dari nilai instance yang baru.[1]

4. Naive Bayes

Suatu model klasifikasi yang memodelkan suatu data untuk menjadi suatu model berbentuk probabilitas, dimana probabilitas setiap nilai variable target untuk satu set veriabel yang diberikan untuk memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya . [1]

5. Decision Tree

Decision Tree (Pohon keputusan) adalah metodologi klasifikasi, di mana proses klasifikasi dimodelkan dengan penggunaan seperangkat keputusan hirarkis pada variabel fitur, disusun dalam susunan pohon struktur. Keputusan pada simpul pohon tertentu, yang disebut sebagai split Kriteria, biasanya suatu kondisi pada satu atau lebih variabel fitur dalam data pelatihan. kriteria split membagi data pelatihan menjadi dua bagian atau lebih. Contoh, pertimbangkan kasus di mana Usia adalah atribut, dan kriteria pemisahan adalah Usia ≤ 30. Dalam hal ini, kiri cabang pohon keputusan berisi semua contoh pelatihan dengan usia paling banyak 30, sedangkan cabang kanan berisi semua contoh dengan usia lebih dari 30. Tujuannya adalah untuk mengidentifikasi perpecahan kriteria sehingga tingkat "pencampuran" variabel kelas di setiap cabang pohon adalah dikurangi sebanyak mungkin. Setiap node di pohon keputusan secara logis mewakili subset dari ruang data yang ditentukan oleh kombinasi kriteria split di node di atasnya. [1]

6. Clustering

Clustering metode penganalisaan data, yang sering dimasukkan sebagai salah satu metode Data Mining, yang tujuannya adalah untuk mengelompokkan data dengan karakteristik yang sama ke suatu ‘wilayah’ yang sama dan data dengan karakteristik yang berbeda ke ‘wilayah’ yang lain.

Contoh aplikasi yang relevan adalah sebagai berikut:

a). Segmentasi pelanggan: Dalam banyak aplikasi, diinginkan untuk menentukan pelanggan yang mirip satu sama lain dalam konteks berbagai tugas promosi produk. Fase segmentasi memainkan peran penting dalam proses ini.

b). Peringkasan data: Karena kelompok dapat dianggap kelompok rekaman yang serupa, kelompok serupa ini dapat digunakan untuk membuat ringkasan data.

b). Aplikasi untuk masalah penambangan data lainnya: Karena pengelompokan dianggap sebagai tanpa pengawasan versi klasifikasi, sering digunakan sebagai blok bangunan untuk menyelesaikan yang terakhir. Selain itu, masalah ini juga digunakan dalam konteks masalah analisis pencilan, [1]

7. K‐Mean Cluster

K‐Mean Cluster  adalah merupakan salah satu algoritma clustering yang  membagi data menjadi beberapa kelompok. Algoritma ini menerima masukan berupa data tanpa label kelas. [1]

8. Estimation

Estimasi adalah untuk menentukan nilai untuk atribut output yang tidak diketahui. Namun, tidak seperti klasifikasi, atribut output untuk masalah estimasi adalah numerik daripada kategorikal. [2]

Berikut adalah empat contoh tugas estimasi:

• Perkirakan jumlah menit sebelum badai akan mencapai lokasi tertentu.

• Perkirakan pengembalian investasi untuk kampanye iklan.

• Perkirakan kemungkinan kartu kredit dicuri.

• Perkirakan panjang semburan sinar gamma.

9. Prediction

Model prediktif adalah untuk menentukan hasil masa depan daripada perilaku saat ini. Atribut keluaran model prediksi dapat berupa kategori atau numerik. Berikut adalah beberapa contoh tugas yang sesuai untuk penambangan data prediktif:

• Prediksi jumlah total touchdown NFL yang akan mencetak skor selama musim NFL 2017

• Tentukan apakah pelanggan kartu kredit kemungkinan akan mengambil keuntungan dari penawaran khusus yang disediakan dengan tagihan kartu kreditnya • Prediksi harga penutupan minggu depan untuk Dow Jones Industrial Average

• Prakiraan pelanggan seluler mana yang akan berganti penyedia selama tiga bulan ke depan Kebanyakan teknik penambangan data yang diawasi sesuai untuk masalah klasifikasi atau estimasi juga dapat membangun model prediksi. Sebenarnya, sifat data yang menentukan apakah model cocok untuk klasifikasi, estimasi, atau prediksi. [2]

10. Association

Asosiasi digunakan untuk menemukan hubungan yang menarik antara atribut yang terkandung dalam database. Tidak seperti aturan produksi tradisional, aturan asosiasi dapat memiliki satu atau beberapa atribut keluaran. Juga, atribut output untuk satu aturan dapat menjadi atribut input untuk aturan lain. Aturan asosiasi adalah teknik yang populer untuk analisis keranjang pasar karena semua kemungkinan kombinasi dari pengelompokan produk yang berpotensi menarik dapat dieksplorasi. Dengan kata lain merupakan  teknik data mining untuk menemukan aturan assosiatifantara suatu kombinasi item. [2]

11. Apriori

Algoritma Apriori menggunakan properti penutupan ke bawah untuk memangkas kandidat ruang pencarian. Properti penutupan ke bawah memaksakan struktur yang jelas pada set frekuensi pola. Secara khusus, informasi tentang jarangnya itemset dapat dimanfaatkan menghasilkan kandidat superset lebih hati-hati. Jadi, jika suatu set item jarang, ada tidak ada gunanya menghitung dukungan dari kandidat supersetnya. Ini berguna untuk menghindari penghitungan boros tingkat dukungan dari itemet yang diketahui tidak sering terjadi. Itu Algoritma Apriori menghasilkan kandidat dengan panjang k lebih kecil pertama dan menghitung dukungan mereka sebelum menghasilkan kandidat panjang (k +1). K-itemset yang dihasilkan sering digunakan untuk batasi jumlah (k + 1) -candidate dengan properti penutupan bawah. Kandidat generasi dan mendukung penghitungan pola dengan bertambahnya panjang disisipkan di Apriori. Karena penghitungan dukungan calon adalah bagian paling mahal dari yang sering proses pembuatan pola, sangat penting untuk menjaga jumlah kandidat tetap rendah.

Daftar Pustaka

[1] Aggarwal, Charu C. (2015), Data Mining (The Textbook),  Switzerland : Springer International Publishing Switzerland 


0 Response to "Definisi terkait Cabang Ilmu AI"

Posting Komentar