Juli 2006


Salah satu penghargaan yang diberikan ACM SIGKDD setiap tahunnya adalah ACM SIGKDD Innovation Award. Penghargaan ini akan diberikan pada konferensi internasional KDD setiap tahunnya (tahun ini, KDD 2006 pada tanggal 20-23 Agustus 2006). Dan, tahun ini yang akan menerima ACM SIGKDD Innovation Award adalah Ramakrishnan Srikant.
Ramakrishnan Srikant saat ini merupakan research scientist di Google, sebelumnya IBM Almaden Research Center. Hasil publikasinya yang paling terkenal adalah “Fast Algorithms for Mining Association Rules” bersama Rakesh Agrawal yang memperkenalkan konsep Apriori untuk association rule (memperoleh penghargaan 10-year best paper award tahun 2004). Beliau banyak memberikan kontribusi pada permasalahan association rules, sequential pattern, dan privacy-preserving data mining.
Banyak orang yang menganggap bahwa data mining dan privacy saling bertolak belakang, dan satu-satunya cara untuk melindungi privacy adalah dengan membatasi penggunaan data mining. Ramakrishnan Srikant dengan cerdik mengatasi asumsi ini dengan mengembangkan teknik privacy-preserving data mining yang bekerja dengan membedakan antara data pada level privacy (data individual) dengan data pada level yang lebih tinggi yang digunakan untuk mining.
Beliau pernah menerima outstanding innovation award (IBM), 2 outstanding technical achievement award (IBM), IBM master inventor tahun 1999, dan ACM Grace Murray Hopper Award tahun 2002 sebagai outstanding young computer professional. Beliau juga terlibat sangat aktif pada beberapa konferensi internasional. Pernah menjadi program co-chair KDD 2001 dan PAKDD 2004, vice chair WWW 2006 dan ICDM 2004, dan deputy chair WWW 2004, tutorials chair KDD 2003, dan industrial track co-chair PAKDD 2003.

Referensi :
1. Srikant’s Home Page. http://www.rsrikant.com/

Setelah beberapa waktu posting blog ini berhenti karena ada beberapa pekerjaan yang harus saya selesaikan, saya akan memulai kembali posting blog ini dengan sebuah sharing singkat.
Survey papers —- seperti judul posting ini, merupakan jenis paper yang sangat berguna untuk mengeksplorasi sebuah topic baru di mana kita sama sekali belum tahu apa saja yang dapat dilakukan pada topic tersebut. Dari paper-paper seperti ini, kita dapat mengetahui permasalahan, perkembangan, dan bahkan future research direction sebuah topic. Benar-benar dapat membuka wawasan untuk mengenal sebuah topic.
Biasanya ciri-ciri paper semacam ini adalah banyak memberikan gambaran singkat tentang apa (umumnya research, solved problem) yang telah dilakukan berikut dengan point-point penekanan dari keunggulan atau pendekatan yang digunakan. Menurut saya sih, dapat dibilang paper semacam ini dapat dijadikan guideline kita yang ingin mendalami sebuah topic dimana kita sama sekali awam dan tidak tahu harus mulai dari mana. Satu hal lagi yang saya suka dari survey paper adalah banyaknya referensi yang bisa ditarik dari paper ini.
Dimana paper-paper seperti ini dapat ditemukan? banyak sekali. Search di google pasti banyak. Umumnya paper-paper ini memang dipublikasikan agar semakin banyak orang yang concern dengan bidang tersebut. Salah satu lain sumber (yang berhubungan dengan data mining) yang bisa saya rekomendasikan adalah SIGKDD Explorations. Beberapa survey paper yang saya baca berasal dari sini. Tiap issue ada special topic yang jadi fokus perhatian.

Philip S. Yu merupakan salah satu peneliti yang paling produktif. Tidak hanya dalam bidang data mining saja, tetapi juga meliputi data stream processing, database systems, internet application and technology, multimedia systems, parallel and distributed processing, dan performace modelling. Tercatat lebih dari 450 paper sudah dipublikasikan Beliau di jurnal ilmiah maupun konferensi internasional. Hebatnya lagi, Beliau memegang lebih dari 250 hak paten (US patents) dari hasil karya Beliau. Sepanjang yang saya ketahui, jumlah ini termasuk hak paten yang paling banyak dimiliki seseorang.
Beliau saat ini merupakan manager Software Tools and Techniques Group di IBM Thomas J. Watson Research Center, ACM Fellow, IEEE Fellow, steering committee of IEEE Data Engineering, steering committee of IEEE ICDM, advisory board Web Intelligence Consortium, associate editor ACM Transactions on the Internet Technology, dan ACM Transactions on Knowledge Discovery in Data. Keterlibatannya dalam berbagai jurnal maupun konferensi internasional dapat dilihat di http://www.research.ibm.com/people/p/psyu/activities.html, sangat banyak. Award yang diperoleh juga tidak sedikit mulai dari IEEE yaitu: Research Contribution Award ICDM 2003, dan IEEE Region 1 Award “promoting and perpetuating numerous new electrical engineering concepts” 1999, serta dari IBM yaitu: 2 IBM Outstanding Innovation Award, Outstanding Technical Achievement Award, 2 Research Division Awards, dan the 85th plateau of Invention Achievement Awards. IBM bahkan menyebut Philip S. Yu sebagai IBM master inventor. Benar-benar luar biasa….

Referensi :
1. IBM Research – Philip S. Yu. http://domino.research.ibm.com/comm/research_people.nsf/pages/psyu.index.html. http://www.research.ibm.com/people/p/psyu/index.html.

Jika ada orang yang membuat saya sangat tertarik dengan data mining, pastilah Jiawei Han orangnya. Jiawei Han termasuk salah satu pioneer data mining yang sangat dikenal. Banyak sekali hasil research Beliau merupakan research fundamental di bidang data mining dan data warehousing. Citeseer mencatat paper-paper Beliau telah dikutip lebih dari 3000 kali. Beliau telah banyak mengembangkan banyak sekali metode data mining dan data warehousing yang meliputi attribute-oriented induction, OLAP mining, frequent pattern mining, graph pattern mining, sequential pattern mining, time series mining, spatial data mining, stream data mining, dan lain-lain.
Jiawei Han juga menulis textbook data mining yang sangat terkenal Data Mining: Concepts and Techniques. Buku ini termasuk buku yang paling lengkap dan up-to-date tentang data mining, banyak sekali algoritma data mining yang dibahas disini. Bahkan, edisi kedua buku ini (yang baru diterbitkan) juga mencakup beberapa advance topic yang meliputi mining data stream, mining data time-series, mining data sequential, graph mining, mining social network, dan multirelational data mining.
Salah satu hasil research Beliau yang memberikan terobosan baru saat dikemukakan pertama kali adalah “mining frequent pattern without candidate generation”. Berbeda dengan yang mainstream saat itu dimana Frequent Pattern dilakukan dengan terlebih dahulu mencari kandidat Frequent Itemset dan menghitung supportnya, pendekatan yang dilakukan adalah menggabungkan dua proses itu secara langsung dengan menggunakan struktur data FP-tree dan algoritma FP-growth. Pendekatan ini banyak menginspirasikan munculnya beberapa algoritma yang lain. Dan, hebatnya pendekatan ini juga terbukti berguna pada pattern yang lain seperti sequential pattern.
Saat ini, Jiawei Han merupakan Professor di UIUC (University of Illinois at Urbana-Champaign), dan Ajunct Professor di SFU (Simon Fraser University). Beliau terlibat sangat aktif dalam berbagai workshop dan konferensi Internasional. Jiawei Han juga merupakan Board of Directors ACM SIGKDD, Editor-in-Chief ACM TKDD, ACM SIGKDD Curriculum Committee, dan Program Committee dari banyak sekali workshop dan konferesi Internasional. Beliau menerima Outstanding Contribution Award ICDM 2002, ACM Service Award 1999, ACM SIGKDD Innovation Award 2004.

Referensi :
1. Jiawei Han. http://www-sal.cs.uiuc.edu/~hanj/. http://www.cs.sfu.ca/~han/.
2. ACM SIGKDD: Awards. http://www.acm.org/sigs/sigkdd/awards.php#2004i.