Data Mining Task

Januari 23, 2006

Data Mining Task

Posted by Philips Kokoh Prasetyo under Term
[26] Comments

Secara umum data mining task dapat dibagi menjadi dua yaitu deskriptif dan prediktif. Deskriptif maksudnya bahwa data mining dilakukan untuk mencari pola-pola yang dapat dipahami manusia yang menjelaskan karakteristik data. Misalnya pencarian kelompok barang yang sering dibeli bersamaan pada data transaksi. Prediktif maksudnya data mining dilakukan untuk membentuk sebuah model pengetahuan yang akan digunakan untuk melakukan prediksi. Misalnya untuk memprediksi pengunjung online sebuah website komersial berdasarkan perilakunya apakah pengunjung ini akan membeli produk website tersebut.
Secara lebih spesifik data mining task berdasarkan fungsionalitasnya adalah sebagai berikut:

Mining Frequent Patterns, Associations, and Correlations : mencari pola-pola yang sering muncul dalam data. Pengetahuannya biasanya berupa rule yang menunjukkan pola-pola tersebut (biasanya disebut association rule). Teknik yang digunakan misalnya Apriori, FP-Growth, CLOSET.
Classification and Prediction : mencari sebuah model yang mampu melakukan prediksi pada suatu data baru yang belum pernah ada. Decision tree, neural network, bayesian network, support vector machines, k-nearest neighbor adalah contoh alat yang digunakan untuk membentuk model tersebut. Classification digunakan untuk prediksi categorical data (diskrit), sedangkan untuk numerical data (numerik) biasanya menggunakan analisa regresi.
Cluster Analysis : mengelompokkan data dalam sebuah cluster berdasarkan kemiripannya. Prinsipnya adalah memaksimalkan kemiripan dalam sebuah cluster, dan meminimalisasikan kermiripan antar cluster. Jadi data-data yang berada pada sebuah cluster akan memiliki kemiripan yang tinggi, dan sebaliknya data akan memiliki nilai kemiripan yang rendah dengan data yang berada pada cluster yang berbeda. Beberapa teknik yang digunakan dalam cluster analysis ini misalnya k-means, k-medoids, SOM, CLARANS, ROCK, BIRCH, Chameleon.
Outlier Analysis : mencari data object yang sifatnya anomali (berbeda dengan sifat umum data). Analisa ini berkaitan dengan yang namanya fraud detection. Justru data anomali tersebut, yang jumlahnya relatif sedikit ini menarik untuk dianalisa. Misalnya deteksi fraud credit card.
Evolution Analysis : mencari model atau tren untuk data-data yang sifatnya terus berubah. Analisa ini berkaitan dengan data time-series. Tasknya bisa meliputi clustering, classification, association dan correlation analysis.

26 Tanggapan to “Data Mining Task”

DM Corner » Association Rule Mining Says:

Mei 16, 2006 at 5:16 pm
[…] Association Rule Mining merupakan bagian dari Frequent Pattern Mining. Frequent Pattern Mining merupakan salah satu task data mining yang sangat penting. Kenapa? Task ini mencari hubungan/relasi, assosiasi, dan korelasi dalam data. Pengetahuan yang dihasilkan juga sangat berguna untuk klasifikasi, clustering, dan task data mining yang lain. Selain Association Rule Mining, masih ada Sequential Pattern, dan Structured Pattern yang termasuk dalam Frequent Pattern Mining. Association Rule Mining dapat juga disebut Frequent Itemset Mining karena pola yang dihasilkan adalah pola item yang sering muncul bersamaan dalam sebuah database. Contoh klasik yang sering digunakan untuk menjelaskan Association Rule Mining adalah market basket analisis. Pada market basket analisis, kita menganalisa kebiasaan customer dalam membeli barang. Misalkan terdapat data transaksi seperti ini. Contoh pengetahuan yang dapat diperoleh dari data di atas adalah {Beer} –> {Diaper} artinya orang yang beli beer biasanya beli diaper juga. Lebih jauh, association rule menjelaskan hubungan korelasi antar item dengan lebih jelas, tidak hanya korelasi kuat atau korelasi lemah saja. Hal ini karena adanya beberapa metrik yang digunakan untuk evaluasi rule. Term-term berikutnya akan membahas lebih lanjut tentang association rule mining termasuk juga teknik yang biasa digunakan. […]
indah Says:

Oktober 29, 2007 at 7:35 am
p’philips..

Pada cluster Analysis tugasnya mengelompokkan data dalam sebuah cluster berdasarkan kemiripannya… setau saya data yang tidak masuk dalam kelas manapun dinamakan ‘outlier’. Tolong berikan kasus apa saja yang bisa diterapkan pada pencarian data yg outlier tersebut…soalnya saya sedang mencari kasus yang tepat untuk penerapan data yg ‘outlier’
thx..
Philips Kokoh Prasetyo Says:

Oktober 30, 2007 at 11:36 am
Hi Indah, yang jelas outlier itu merupakan data yang tidak regular. Bisa dibilang lain dari kondisi normal.
Aplikasi outlier detection cukup banyak misalnya: fraud detection, dan intrusion detection.
Coba saja googling, anda pasti akan dapat menemukan banyak paper dan resource tentang outlier detection.
rian Says:

November 15, 2007 at 1:29 am
hai philips…
Pada cluster analisis kan tujuannya untuk pengelompokan data berdasarkan kemiripannya.jadi setelah kita melakukan clusterisasi data, kita dapatkan data yang berkelompok-kelompok. dari data yang berkelompok tersebut kita kan bisa melakukan interpretasi lebih lanjut. jadi saya tanyain, interpretasi tersebut seperti apa? contoh analisa kasus seperti apa yang bisa kita lakukan?.terima kasih
Philips Kokoh Prasetyo Says:

November 17, 2007 at 6:02 am
hi Rian,
banyak sekali yang dapat dilakukan pada cluster analisis. Yang jelas data yang mirip akan cenderung mengelompok. Anda dapat mencari outlier, atau mencari data yang paling sesuai untuk representasi sebuah kelompok, atau feature selection.
shofie Says:

April 30, 2008 at 9:07 am
pa philips
mo nanya dunk….

1. sebenernya methode di clustering da berapa c
dari yang saya baca ada macem2 versi.
2. K- median ma K-Medoids sama gak

makasi pak philips
maaf merepotkan
di tunggu jawabannya….
David Says:

Mei 8, 2008 at 8:07 am
mr philips,
sorry mo nanya nih.
saya sedang ambil TA – data mining. kira2 algoritma apa ya yang cocok untuk kasus seperti ini nih :
1. analisa dari data2 aplikan yang mengajukan kredit dari suatu bank.
Tujuannya : untuk mengklasifikasikan aplikan2 yang ‘layak’ diberi kredit, dan ‘layak’ diberi kredit lanjutan.
First thought, pasti pake clustering..tapi masalahnya udah dibatasi ma dosen ga blh pake k-means.
So diusahakan pake DM function yang ada di SQLSERVER2005.
Kinda confused here..
Help me out sir.
so sorry to bother before..

thanx
Philips Kokoh Prasetyo Says:

Mei 8, 2008 at 12:15 pm
@David:
Banyak jalan menuju Roma. Jadi, semua cara seharusnya bisa dipakai untuk task tersebut.
Coba baca-baca referensi dulu terkait deh.
Philips Kokoh Prasetyo Says:

Mei 8, 2008 at 12:17 pm
@shofie:
Memang benar, banyak sekali cara yang bisa digunakan untuk clustering.
Saya tidak pernah mendengar ada nama k-median, yang ada seharusnya k-medoids. Anyway, memang prinsipnya menggunakan median sebagai cluster center.
infoGue Says:

Juni 26, 2008 at 7:36 am
artikel anda ada di:

http://datamining.infogue.com/data_mining_task

anda bisa promosikan artikel anda di infogue.com yang akan berguna untuk semua pembaca. Telah tersedia plugin/ widget vote & kirim berita yang ter-integrasi dengan sekali instalasi mudah bagi pengguna. Salam!
puji Says:

Februari 13, 2009 at 4:57 pm
hi,
lagi ambil skripsi mengenai clustering
tadinya mau pake k-means,,
tapi begitu tau ada k-medoids jadi tertarik..
bedanya apa yah??
,makasih,
riyan Says:

Mei 3, 2009 at 2:11 pm
p’ philips, mo nanya nih, subspace clustering kan seperti mengoptimalkan proses clustering ya, jd seperti menghilangkan noise2 yang ada di data. emang kalo clustering biasa g ngehandle keberadaan noise ya??? trus case study yg cocok untuk subspace clustering kira2 tentang kasus apa ya???mohon sekali jawabannya. trim;s
riyan Says:

Juli 2, 2009 at 12:25 pm
Salam kenal, saya Ariyani. Saya ingin ambil TA tentang text mining. Saya ingin ambil studi kasus transformasi bentuk verb 1 ke verb 2, atau ke verb 3. Tapi saya belum bisa menemukan referensi tentang itu. Apakah Pak Philips ada jurnal ada info yang bisa membantu saya memberi informasi tentang hal tersebut?
Terima kasih banyak sebelumnya Pak, saya sangat mengharap bantuan Pak Philips

Ariyani
Hertartik Clarasita Says:

September 4, 2009 at 5:17 am
Pak saya mau tanya, metode data mining yang cocok untuk :
1. Hubungan jurusan di SMA (IPA, IPS, Bahasa) dengan IPK kuliah

2. Hubungan gelombang dan pilihan pada saat pendaftaran Universitas dengan IPK

Tolong ya pak, saya memerlukan metode untuk masing-masing kasus diatas, trimakasih.
phiet Says:

Januari 10, 2010 at 8:41 am
hi..
mau tau donk persamaan dan perbedaan antara prediksi dan forecasting…
thx
Philips Kokoh Prasetyo Says:

Januari 10, 2010 at 3:41 pm
@phiet: beda istilah saja. Seharusnya kedua hal tersebut sama deh.
Anna Says:

Januari 18, 2010 at 1:47 pm
pak saya mau mengambil TA mengenai association analysis pda data mining.. kira2 ada referensi ga yang bisa saya dapatkan..
terima kasih banyak..
istiyanah (@istiyanah1) Says:

Oktober 3, 2012 at 12:40 pm
pak saya mau tanya tentang data minning teknik clustering,
apakah perbedaan k-means sama k-medoids itu terletak pada ketika menghitung pusat clusternya?
kalau k-means cara ngitung pusat clusternya dengan rata-rata dan kalau k-medoids itu menghitungnya dengan median ?
1. Philips Says:
  
  Oktober 6, 2012 at 9:39 am
  Yup.
  k-mean pake mean value
  k-medoids pake median value
  1. hamachi Says:
    
    Oktober 11, 2015 at 3:51 pm
    kalau seandainya saya punya object berjumlah genap dalam 1-dimensional, misal 2, 3, 30, 100, 5, 9. apa tetap menggunakan median juga?
robson Says:

Desember 15, 2012 at 4:47 am
pak saya mau tanya apakah punya informasi atau referensi contoh cara perhitungan menggunakan algoritma Classification Based On Association (CBA) ?
1. Philips Kokoh Prasetyo Says:
  
  Desember 17, 2012 at 12:29 am
  Referensi untuk algoritma ini banyak sekali mengingat algoritma ini cukup lama. Coba googling:
  https://www.google.com/search?q=cba+classification+based+association+rules&aq=1&oq=CBA+classification+based&sugexp=chrome,mod=6&sourceid=chrome&ie=UTF-8
  Saya lihat banyak referensi menjelaskan algoritma ini dengan baik.
  Yang paling baik sebaiknya refer ke paper aslinya.
Sultan MhMc Says:

November 28, 2013 at 1:06 am
kk semua,,,sy dikasih judul skripsi sama dosen tentang data mining

DATA MINING NAMA JALAN PADA WILAYAH SUMATERA SELATAN (PETA)

yang ingin saya tanyakan,,,yang bisa didata minigkan apanya??
kalo bisa kasih contohnya dikit??

terima kasih All..
Saniargi Sofyan Says:

Maret 23, 2016 at 3:19 pm
misi saya mau nanya kalo misalnya pemberian diskon suatu barang apa bisa masuk kedalam association rule?
Association Rule Mining | IWAWANSURYAWAN Says:

Desember 12, 2016 at 4:58 pm
[…] Mining merupakan bagian dari Frequent Pattern Mining. Frequent Pattern Mining merupakan salah satu task data mining yang sangat penting. Task ini mencari hubungan/relasi, assosiasi, dan korelasi dalam data. […]
panduanblog.id Says:

Oktober 13, 2021 at 4:39 pm
Terima kasih banyak atas pembahasan mengenai Data Mining.