Setelah membaca survey link mining di SIGKDD Exploration December 2005 Vol7 Issue 2 (lihat post SIGKDD Exploration December 2005), saya jadi tahu bahwa link mining merupakan bagian yang menarik dan cukup luas dalam data mining. Bidang ini sangat berkaitan dengan yang namanya graph. Dalam survey tersebut, link mining dibagi menjadi delapan task yang dapat dikategorisasi sebagai task-task yang fokus pada object, link dan graph. Berikut ini adalah 8 task link mining pada survey tersebut:

  • Object-Related tasks
    1. Link based Object Ranking
    2. Link-based Object Classification
    3. Object Clustering (Group Detection)
    4. Object Identification (Entity Resolution)
  • Link-Related tasks
    1. Link Prediction
  • Graph-Related tasks
    1. Subgraph Discovery
    2. Graph Classification
    3. Generative Models for Graph

Link mining mengarah pada teknik data mining yang digunakan untuk membentuk sebuah model pengetahuan dari data-data yang saling berhubungan/berkaitan (linked data). Pengetahuan dari hubungan antar-object inilah yang dimining.
Ada dua jenis tipe link : homogen, dan heterogen. Yang homogen misalnya seperti social network dimana setiap object dihubungkan dengan hubungan teman (seperti model2 friendster), dan WWW yang merupakan kumpulan halaman web yang saling berhubungan. Yang heterogen ini lebih rumit, misalnya seperti network pada bidang medis yang menjelaskan hubungan pasien dengan penyakit dan treatment atau pada bibliografi yang menghubungkan publikasi, penulis, dan conference. Bentuk data yang seperti ini sangat baik direpresentasikan sebagai graph.
Linked data berbeda dengan data biasa yang tiap objectnya saling independent. Hal ini memberikan tantangan baru untuk mengembangkan teknik-teknik data mining baru. Selain itu, link mining semakin berkembang karena semakin banyak data saat ini yang direpresentasikan sebagai kumpulan hubungan antar object. Bersambung ke Survey Link Mining (2).