Kemajuan di bidang ilmu pengetahuan dan teknologi mendorong pertumbuhan data di dunia. Berbagai fenomena alam semakin mudah diobservasi dan didokumentasikan. Keberadaan data sebagai nyawa dari tumbuh dan berkembangnya teknologi menjadi sangat mudah diperoleh. Apalagi perkembangan teknologi hardware dan software yang semakin pesat dan semakin murah, membuat proses dokumentasi menjadi semakin mudah. Faktor-faktor ini akhirnya menyebabkan terjadinya “ledakan data” di berbagai bidang. Misalnya kalau di biologi, pertumbuhan pesat data genome dapat dilihat di situs genbank (http://www.ncbi.nih.gov/Genbank/genbankstats.html)
Sedangkan informasi yang berupa teks, pertumbuhannya tidak kalah pesat. Di situs Medline, jumlah abstrak yang didokumentasikan tahun 2003 dilaporkan sekitar 12 juta. Kalau satu abstrak terdiri dari 200 kata, maka sekitar 2.4 milyar kata terekam di Medline.

Data dan teks yang melimpah ini tidak akan ada artinya, bila tidak ada metode komputasi efektif yang mampu mengolah data berskala besar, dan menggali informasi terpendam di dalamnya. Datamining adalah solusi yang ditawarkan oleh teknologi komputasi agar informasi yang selama ini terpendam di tumpukan data itu dapat digali dan dimanfaatkan. Aplikasi datamining sangat luas dan terdapat di berbagai bidang. Bagi pelaku bisnis misalnya, datamining bermanfaat untuk mengetahui kecenderungan perilaku konsumen di supermarket maupun toko online, sehingga mereka dapat merancang strategi jitu untuk meningkatkan pelayanan pada konsumen.

Pentingnya data dan teknologi datamining ini telah dirasakan oleh kalangan iptek Indonesia. Upaya penyediaan data ilmiah, misalnya dengan pengadaan mirror scientific data (L.T.Handoko dkk.) yang beralamatkan di http://www.arsip.lipi.go.id/.
Beberapa data penting di bidang bioteknologi, bioinformatika, dan fisika seperti GenBank, Protein Data Bank (PDB), Particle Data Group (PDG), telah dapat diakses mudah dari Indonesia. Walau masih terbatas, tapi setidaknya telah dimulai upaya untuk mempermudah akses komunitas Indonesia ke berbagai data ilmiah penting.

Bagaimana dengan teknologi datamining ?
Akhir-akhir ini seminar, pelatihan, workshop mengenai datamining telah dilakukan di berbagai instansi, antara lain STTTelkom, ITB, Politeknik ITS, dsb. Ini adalah berita yang menggembirakan, dan menunjukkan bahwa potensi datamining telah mulai diperhatikan di Indonesia. Namun demikian, upaya untuk menyelenggarakan seminar berbasis internet di bidang ini masih dirasakan kurang kalau tidak dapat dikatakan belum pernah dilakukan oleh komunitas internet Indonesia. Padahal umumnya kalangan mahasiswa, peneliti dan praktisi teknologi di Indonesia telah terbiasa berkomunikasi lewat internet, dan persentase mereka cukup besar. Menurut Onno Purbo porsi diskusi keilmuan di internet berada pada kisaran 19% dari keseluruhan posting di internet. Angka ini termasuk jumlah yang signifikan, dan menempati peringkat kedua setelah posting yang sifatnya silaturahmi (21.9%). Pornografi yang selama ini dikhawatirkan ternyata berada pada prosentase yang lebih kecil yaitu 12.9%. Penelitian Onno yang dimuat di situs ilmukomputer.com ini, memberikan harapan segar bahwa ternyata perhatian masyarakat terhadap perkembangan iptek cukup besar.

Dalam hal ini, komunitas softcomputing Indonesia (sc-ina@yahoogroups.com) dan komunitas datamining Indonesia (http://groups.yahoo.com/group/indo-dm) bekerja sama menyelenggarakan e-kolokium bertemakan datamining dan text-mining, yang akan disajikan oleh dua peneliti Indonesia yang aktif melakukan riset di bidang ini.

Jadwal dan tema presentasi adalah sbb.
1. Tgl. : 18-31 Agustus 2006
Judul : Pengantar Data Mining
Penyaji : Dr. Iko Pramudiono (Nippon Telegraph & Telephone Co., Japan)
Abstrak :
Data Mining (DM) adalah salah satu bidang yang berkembang pesat karena besarnya kebutuhan akan nilai tambah dari database skala besar yang makin banyak terakumulasi sejalan dengan pertumbuhan teknologi informasi. Definisi umum dari data mining itu sendiri adalah serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data. Dalam tulisan ini, penulis mencoba memperkenalkan data mining dengan membandingkannya dengan bidang ilmu yang sudah ada, dan juga memberikan beberapa ilustrasi tentang teknik-teknik yang umum dipakai di data mining.
2. Tgl. : 1-15 September 2006
Judul : Knowledge Discovery in Scientific Documents
Penyaji : Dr. Igg Adiwijaya (AdvanTechnologies, Inc. & University of Maryland, USA)

Makalah presentasi dan diskusi (tanya jawab) akan diforward ke dua milis (indo-dm@yahoogroups.com & sc-ina@yahoogroups.com). Dengan mengikuti kegiatan ini diharapkan peserta dapat memahami konsep teknologi datamining dan text mining, yang mungkin akan bermanfaat bagi riset dan bidangnya masing-masing. Semoga kegiatan ini dapat bermanfaat bagi perkembangan iptek di Indonesia.

Alamat milis :
– Komunitas Softcomputing Indonesia (web: http://soft-computing.org milis: sc-ina@yahoogroups.com)
– Komunitas Datamining Indonesia (milis : indo-dm@yahoogroups.com)