Secara umum, Association Rule Mining dapat dibagi menjadi dua tahap:
- Pencarian Frequent Itemset
Pada proses ini dilakukan pencarian Frequent Itemset. Frequent Itemset yang diperoleh harus memenuhi minimum support (lihat post Itemset, Support, dan Confidence). - Rule Generation
Frequent Itemset yang telah dihasilkan dari proses sebelumnya digunakan untuk membentuk Association Rule. Association Rule yang dihasilkan akan memenuhi minimum support dan minimum confidence.
Masalah utama yang muncul pada pencarian Frequent Itemset adalah banyaknya hasil Frequent Itemset yang memenuhi threshold minimum support. Semakin rendah threshold minimum support, Frequent Itemset yang dihasilkan akan semakin banyak. Jika terdapat d item, maka akan diperoleh 2d-1 kombinasi itemset yang bisa diperoleh. Contoh: 100 item akan menghasilkan kombinasi itemset 2100-1. Jumlah itemset ini sangat banyak untuk dapat disimpan atau diproses pada komputer manapun. Untuk mengatasi hal ini, muncul istilah Closed Frequent Itemset dan Maximal Frequent Itemset.
Juni 22, 2006 at 2:31 am
[...] Secara umum, terdapat dua tahap dalam melakukan Association Rule Mining yaitu Frequent Itemset Candidate Generation dan Rule Generation. Pada tahap Frequent Itemset Candidate Generation terdapat beberapa kendala yang harus dihadapi untuk memperoleh Frequent Itemset seperti banyaknya jumlah kandidat yang memenuhi minimum support, dan proses perhitungan minimum support dari Frequent Itemset yang harus melakukan scan database berulang-ulang. Pendekatan Apriori sangat membantu dalam mengurangi jumlah kandidat Frequent Itemset. Apakah mungkin candidate generation ini tidak dilakukan? Dengan menggunakan FP-growrh, kita dapat melakukan Frequent Itemset Mining tanpa melakukan candidate generation. FP-growth menggunakan struktur data FP-tree. Dengan menggunakan cara ini scan database hanya dilakukan dua kali saja, tidak perlu berulang-ulang. Data akan direpresentasikan dalam bentuk FP-tree. Setelah FP-tree terbentuk, digunakan pendekatan divide and conquer untuk memperoleh Frequent Itemset. FP-tree merupakan struktur data yang baik sekali untuk Frequent Pattern mining. Struktur ini memberikan informasi yang lengkap untuk membentuk Frequent Pattern. Item-item yang tidak frequent (infrequent) sudah tidak ada dalam FP-tree. [...]
Desember 15, 2007 at 10:19 am
mas/mbak bisa minta algoritmanya untuk buat pola di association rule mining gak. sekarang gi ngerjakan tugas akhir kebetulan q pake metode association rule gitu, bisa gak ya.. thanks b4
Desember 17, 2007 at 8:06 am
@Ika:
Anda dapat menemukan banyak implementasi association rule mining di FIMI (http://fimi.cs.helsinki.fi/)
Desember 4, 2008 at 7:35 am
Saya sedang menyusun Tugas Akhir, dan saya tertarik dengan Classification Based on Association (CBA) pada data mining. Saya menggunakan SQL Server dan C#.
Mohon Bantuannya.
Terima Kasih.