Kebutuhan akan information retrieval


Hari jumat lalu, saya dan rekan-rekan berdiskusi tentang rencana sebuah penelitian terkait dengan penerapan information retrieval pada setumpuk dokumen yang dimiliki oleh salah satu unit di tempat saya bekerja. Hal menarik yang menjadi awal pembicaraan kami adalah, dari unit yang membutuhkan belum begitu memahami tentang apa yang sebetulnya di butuhkan. Dari situlah, pembicaraan terarah pada bentuk kebutuhan yang ingin dapat dibantu dengan adanya teknologi informasi.

Secara prinsip, salah satu unit ini memiliki segudang dokumen-dokumen, baik dalam bentuk doc, pdf, text, email, gambar bahkan video. Yang menjadi titik berat kebutuhan adalah bagaimana agar semua dokumen tersebut dapat tersimpan dengan baik di suatu “tempat” aman dan mengijinkan para pemakainya (yang terautorisasi dan terotentikasi) untuk melakukan pencarian terhadap dokumen-dokumen tersebut.

Menarik, inilah ladang information retrieval dapat diterapkan. Secara sederhana saya menggambarkan alur kerja dari teknologi yang dapat digunakan untuk menyediakan layanan tersebut.  Untuk dapat menyimpan dokumen dengan “aman”, dapat digunakan sebuah repository server. Sebuah repositoy server biasanya sudah mencakup fasilitas otentikasi, otorisasi, metadata, document space (folder), pencarian dokumen dan juga mendukung multi protokol pertukaran dokumen, seperti ftp, http dan webdav. Masalahnya adalah, repository server ini belum semuanya mendukung metadata/anotasi untuk dokumen gambar atau video. Sehingga perlu di cari pemecahaan untuk hal ini. Saya berencana untuk memasukan anotasi XML ke dalam objek dokumen gambar atau video tersebut. Dengan anotasi sederhana ini, nantinya dapat digunakan oleh IR indexer untuk melakukan pengindeksan. Saat ini sedang banyak dikembangkan algoritma-algoritma untuk menerapkan information retrieval khusus untuk dokumen-dokumen non teks. Tapi untuk kontek permasalahan ini, saya cukup memberikan anotasi agar dapat memberikan informasi kepada IR untuk melakukan pencariannya.

Syukurlah, penjelasan yang singkat itu dapat membantu untuk melanjutkan pembahasan berikutnya secara fokus pada kebutuhan yang diinginkan.