Pada pembahasan sebelumnya kita sudah membahas Apa itu Data Mining ?, jadi pada kesempatan kali ini mimin akan melanjutkan postingan mengenai tugas dari data mining tersebut.
Postingan terkait : Data Mining: Apa itu Data Mining ?
Data Mining berkaitan dengan jenis pola-pola yang dapat ditambang. Berdasarkan jenis data untuk ditambang, ada dua jenis fungsi terlibat dalam Data Mining −
- Deskriptif
- Klasifikasi dan prediksi
Fungsi deskriptif
Fungsi deskriptif berkaitan dengan sifat-sifat umum data dalam database. Berikut adalah daftar deskriptif fungsi −
- Class/Concept Description
- Mining of Frequent Patterns
- Mining of Associations
- Mining of Correlations
- Mining of Clusters
Deskripsi kelas konsep
Kelas konsep mengacu pada data yang berhubungan dengan kelas atau konsep. Misalnya, dalam sebuah perusahaan, termasuk kelas barang untuk penjualan komputer dan printer, dan konsep-konsep pelanggan termasuk pemboros besar dan anggaran pemboros. Seperti Deskripsi kelas atau konsep yang disebut kelas konsep Deskripsi. Deskripsi ini dapat diperoleh oleh − dua cara berikut
- Data karakterisasi − Ini merujuk kepada meringkas data dari kelas bawah studi. Kelas ini di bawah study disebut sebagai Target kelas.
- Data diskriminasi − Itu mengacu pada pemetaan atau klasifikasi kelas dengan beberapa kelompok standar atau kelas.
Pola dari data mining
Sering pola yang pola-pola yang sering terjadi di data transaksi. Berikut adalah daftar jenis pola sering −
- Frequent Item Set − mengacu pada satu set barang yang sering muncul bersama-sama, misalnya, susu dan roti.
- Frequent Subsequence − Sebuah urutan pola yang sering terjadi seperti membeli kamera yang diikuti oleh kartu memori.
- Frequent Sub Structure − substruktur mengacu pada bentuk struktural yang berbeda, seperti grafik, pohon atau kisi-kisi, yang dapat dikombinasikan dengan item−sets atau sub sequences.
Asosiasi Data Mining
Asosiasi yang digunakan dalam retail penjualan untuk mengidentifikasi pola-pola yang sering dibeli bersama. Proses ini merujuk kepada proses mengungkap hubungan antara data dan menentukan aturan Asosiasi.
Sebagai contoh, seorang pengecer menghasilkan aturan Asosiasi yang menunjukkan bahwa 70% dari waktu susu dijual dengan roti dan hanya 30% dari kali biskuit dijual dengan roti.
Korelasi Data Mining
Ini adalah semacam analisis tambahan yang dilakukan untuk mengungkap menarik Statistik korelasi antara pasangan terkait-attribute−value atau antara dua set item untuk menganalisis bahwa jika mereka memiliki positif, negatif atau tidak berpengaruh pada satu sama lain.
Cluster Data Mining
Cluster mengacu pada sekelompok jenis objek yang serupa. Analisa cluster mengacu pada membentuk grup objek yang sangat mirip satu sama lain tapi sangat berbeda dari benda-benda di kluster lainnya.
Klasifikasi dan prediksi
Klasifikasi merupakan proses menemukan model yang menggambarkan data kelasatau konsep. Tujuan adalah untuk dapat menggunakan model ini memprediksi kelas obyek label kelas yang tidak diketahui. Model ini diturunkan didasarkan pada analisis kumpulan data pelatihan. Model berasal dapat disajikan dalam bentuk − berikut
- Klasifikasi (jika-maka) aturan
- Decision Trees
- Formula matematika
- Neural Networks
Daftar fungsi yang terlibat dalam proses ini adalah sebagai berikut −
- Klasifikasi − memprediksi kelas obyek label kelas yang tidak diketahui. Tujuannya adalah untuk menemukan model turunan yang menjelaskan dan membedakan data kelas atau konsep. Model berasal didasarkan pada set analisis data pelatihan yaitu objek data label kelas yang terkenal.
- Prediksi − digunakan untuk memprediksi hilang atau tidak tersedia data numerik nilai-nilai daripada kelas label. Analisis regresi umumnya digunakan untuk prediksi. Prediksi juga dapat digunakan untuk identifikasi tren distribusi berdasarkan data yang tersedia.
- Outlier analisis − Outliers dapat didefinisikan sebagai objek data yang tidak sesuai dengan perilaku umum atau model data yang tersedia.
- Evolusi analisis − evolusi analisis merujuk kepada keteraturan Deskripsi dan model atau trend untuk objek yang tingkah lakunya berubah seiring waktu.
Tugas Primitif Data Mining
- Kita dapat menentukan tugas pertambangan data dalam bentuk permintaan pertambangan data.
- Query ini masukan ke sistem.
- Permintaan pertambangan data didefinisikan dalam hal data pertambangan tugas primitif.
Perhatikan − primitif ini memungkinkan kita untuk berkomunikasi secara interaktif dengan sistem data mining. Berikut adalah daftar Data Mining tugas primitif−
- Set tugas data yang relevan untuk ditambang.
- Jenis pengetahuan untuk ditambang.
- Latar belakang pengetahuan untuk digunakan dalam proses penemuan.
- Langkah-langkah Interestingness dan ambang batas untuk evaluasi pola.
- Perwakilan untuk memvisualisasikan pola yang ditemukan.
Serangkaian tugas data yang relevan untuk ditambang
Ini adalah bagian dari database di mana pengguna tertarik. Bagian ini mencakup −berikut
- Atribut database
- Dimensi gudang data menarik
Jenis pengetahuan untuk ditambang
Ia merujuk kepada jenis fungsi harus dilakukan. Fungsi-fungsi ini adalah −
- Karakterisasi
- Diskriminasi
- Asosiasi dan korelasi analisis
- Klasifikasi
- Prediksi
- Pengelompokan
- Analisis outlier
- Evolusi analisis
Latar belakang pengetahuan
Pengetahuan latar belakang yang memungkinkan data ditambang di beberapa tingkatan abstraksi. Sebagai contoh, hirarki konsep adalah salah satu pengetahuan latar belakang yang memungkinkan data ditambang di beberapa tingkatan abstraksi.
Langkah-langkah Interestingness dan ambang batas untuk pola evaluasi
Ini digunakan untuk mengevaluasi pola yang ditemukan oleh proses penemuan pengetahuan. Ada berbagai langkah-langkah untuk berbagai jenis pengetahuan yangmenarik.
Perwakilan untuk memvisualisasikan pola ditemukan
Ini merujuk kepada bentuk di mana menemukan pola-pola yang akan ditampilkan.Pernyataan ini mungkin termasuk − berikut
- Aturan
- Tabel
- Charts
- Grafik
- Pohon-pohon keputusan
- Kubus