News


Enam algoritma machine learning sedang dikembangkan untuk large-scale, distributed storaged, dan paralel processing di Google selama beberapa tahun terakhir ini. Disebutkan bahwa enam algoritma tersebut adalah Support Vector Machine (SVM), Singular Value Decomposition (SVD), Spectral Clustering, Association Mining, Probabilistic Latent Semantic Analysis (PLSA), dan Latent Dirichlet Allocation (LDA). Bahkan, PSVM sudah tersedia secara public dan dapat didownload. Btw, PSVM merupakan salah satu project hasil 20% time. Sebuah task SVM yang memerlukan tujuh hari pada sebuah komputer dapat diselesaikan dalam waktu dua jam dengan menggunakan PSVM pada 200 komputer.
Algoritma-algoritma di atas merupakan algoritma yang saat ini termasuk algoritma yang terbukti efektif dengan pondasi teori yang sangat kuat, namun komputasinya sangat tinggi. Pada SIGMOD record March 2008, Edward Chang, salah satu peneliti Google, melaporkan bahwa SVM, SVD, PLSA, dan LDA sangat berguna untuk klasifikasi dan collaborative filtering di Google. Google Knowledge search (baru tersedia di Rusia), dan Laiba (produk social-network dengan platform Orkut yang juga baru tersedia di Cina) adalah produk-produk terbaru Google yang menggunakan algoritma-algoritma ini pada infrastukturnya.
Apakah algoritma-algoritma ini akan menjadi tren machine learning masa depan??

Selain tentang algoritma machine learning yang sedang dikembangkan Google, paper “Data Management Projects at Google” juga menceritakan beberapa proyek Google yang lain termasuk Crawling Deep Web, Searching HTML Tables, BIGTable, dan MiniTables.

Referensi:
1. Data Management Projects at Google. SIGMOD Record, March 2008. (Vol. 37, No. 1)
2. PSVM – a parallel version of support vector machine

Di tengah-tengah kesibukan studi, secara tidak sengaja saya menemukan bahwa tulisan saya, Berburu Resource di Internet, muncul di majalah online Inovasi, tepatnya di Inovasi Edisi Vol.9/XIX/November 2007. Thanks to majalah online Inovasi. Thanks to Google for linking me to the resource :) .
Sebelumnya sempat terpikir bahwa tulisan ini mungkin tidak masuk karena sudah lama tidak ada kabarnya, ternyata penerbitannya majalahnya yang molor.
Tulisan saya ini mungkin akan sangat berguna bagi teman-teman dalam mencari resource di Internet, terutama yang sedang mengerjakan riset atau tugas akhir. Banyak sekali yang bertanya sumber-sumber resource berkaitan dengan data mining di blog ini. Karena data mining itu sangat luas dan banyak sekali hal yang saya juga masih belajar, semoga artikel ini bisa jadi guideline awal dalam berburu resource di internet. Paling tidak trik-trik ini sangat ampuh selama saya berburu resource di internet.
Teman-teman mungkin juga dapat membuka bagian Tips dari blog ini. Ada beberapa posting terkait dengan berburu resource.

Artikel dapat didownload di sini [link baru].

Update 20 Maret 2008:
Sepertinya memang ada perubahan struktur website majalah inovasi. saya baru saja update link sumbernya. Thanks to Google… :)

Penerima IEEE ICDM Awards 2007 sudah diumukan, seperti biasa dua kategori, IEEE ICDM Research Contribution Award dan IEEE ICDM Outstanding Service Award.
Penerima IEEE ICDM Research Contribution Award 2007: Dr. J. Ross Quinlan
Penerima IEEE ICDM Outstanding Service Award 2007: Dr. Gregory Piatetsky-Shapiro
Selamat buat Dr. J. Ross Quinlan dan Dr. Gregory Piatetsky-Shapiro.

Referensi:
1. 2007 IEEE ICDM Research Contributions Award: Dr. J. Ross Quinlan. http://www.cs.uvm.edu/~icdm/awards/Quinlan-07.shtml
2. 2007 IEEE ICDM Outstanding Service Award: Dr. Gregory Piatetsky-Shapiro. http://www.cs.uvm.edu/~icdm/awards/Piatetsky-07.shtml

Note:
Profil singkat Dr. J. Ross Quinlan dan Dr. Gregory Piatetsky-Shapiro sudah pernah muncul pada posting tokoh di DM Corner.
Profil Dr. J. Ross Quinlan:http://philips.wordpress.com/2006/06/13/ross-quinlan/
Profil Dr. Gregory Piatetsky-Shapiro: http://philips.wordpress.com/2006/05/08/gregory-piatetsky-shapiro/

IEEE ICDM Data Mining Contest 2007 (IEEE ICDM DMC’07) adalah kompetisi pertama kali diadakan pada IEEE ICDM.
Kompetisi pertama ini mengambil permasalahan tentang estimasi lokasi indoor radio signal strength (RSS) yang diterima oleh sebuah client device dari berbagai WiFi access points.
Registrasi kompetisi ini sudah dibuka. Detil tentang kompetisi ini dapat dilihat di http://www.cse.ust.hk/~qyang/ICDMDMC07/.

Website yang sangat menarik,Videolectures.net, menyediakan free video lectures, talks, interviews on demand. Tujuannya kalo dilihat dari tag linenya adalah exchange ideas / share knowledge. Banyak sekali rekaman video kuliah, seminar, dan interview di sini terutama bidang Computer Science (saat tulisan ini diposting, video tentang Computer Science paling banyak). Mungkin di kemudian hari akan semakin banyak rekaman dari bidang-bidang yang lain.

Video-video KDD Conference 2007 kemarin juga ada di site ini: http://videolectures.net/kdd07_sanjose/.
Menonton video ini bagaikan belajar langsung dari pakarnya, merasakan suasana KDD conference. Hehehe, maklum, belum mampu ikutan KDD conference. :)

Link website ini akan saya tambahkan di blogroll blog ini.

SIGKDD Exploration June 2007, Volume 9, Issue 1.
Special issue SIGKDD kali ini adalah tentang data mining untuk health informatics. Ada beberapa paper tentang topik ini.
Selain itu, ada juga artikel interview Gregory Piatetsky dengan Simon Funk.
http://www.acm.org/sigs/sigkdd/explorations/issue.php?volume=9&issue=1&year=2007&month=06

SIGKDD telah mengumumkan penerima penghargaan SIGKDD. Seperti tahun-tahun sebelumnya, terdapat dua kategori yaitu: SIGKDD Innovation Award, dan SIGKDD Service Award.
Penerima 2007 SIGKDD Innovation Award : Dr. Usama M. Fayyad
Penerima 2007 SIGKDD Service Award : Dr. Robert Grossman
Penghargaan akan diberikan pada KDD-2007 12 Agustus 2007 mendatang.

Selamat buat Dr. Usama M. Fayyad dan Dr. Robert Grossman.

Referensi :
1. ACM SIGKDD: SIGKDD Innovation Awards. http://sigkdd.org/awards_innovation.php#2007i
2. ACM SIGKDD: SIGKDD Innovation Awards. http://sigkdd.org/awards_service.php#2007s

Note:
Profil singkat Dr. Usama M. Fayyad pernah muncul pada posting tokoh di DM Corner, dapat dibaca di http://philips.wordpress.com/2006/05/16/usama-fayyad/. Profil Robert Grossman akan muncul pada posting tokoh berikutnya di DM Corner.

Satu lagi challenge yang berkaitan dengan data mining.
Spock (http://www.spock.com/), people search application, memberikan tantangan berhadiah $50000. Problemnya tentang entity resolution.
Entity resolution merupakan salah satu permasalahan link mining yang menarik (survey link mining dapat dilihat di SIGKDD Exploration Volume 7, Issue 2, December 2005, review singkat dalam bahasa Indonesia dapat dilihat di Survey Link Mining).
Jelas sekali bahwa entity resolution sangat diperlukan pada people search application karena di dunia ini banyak orang yang memiliki nama yang sama. Nama Michael Jackson misalnya, bisa jadi nama penyanyi atau nama pemain football di Amerika.
Task problem ini adalah menentukan real world entity (nama orang) pada dataset yang berupa dokumen, membagi dokumen-dokumen tersebut pada real world entity (nama orang) yang relevan. Jadi, misalnya jika ada orang mencari Michael Jackson seorang penyanyi, maka hasilnya jangan sampai tercampur dengan Michael Jackson seorang pemain football. Menarik bukan??
Detil informasi lebih lengkap tentang Spock Challenge : http://challenge.spock.com/

ECML/PKDD 2007 Discovery Challenge juga telah dimulai. Ada tiga problem yang dapat dipilih untuk diikuti: User’s behaviour prediction, HTML traffic prediction, dan Sumerian literature understanding.
Informasi lebih lengkap tentang Discovery Challenge ini dapat dilihat pada:
http://www.ecmlpkdd2007.org/challenge/

Data Mining Cup 2007 telah dimulai. Tasknya seputar rebate system pada check-out couponing.
Detil lebih lengkap dapat dilihat pada:
http://www.data-mining-cup.com/2007/Wettbewerb/

Halaman Berikutnya »