Clustering (pengelompokan dokumen) merupakan salah satu teknik yang dapat
digunakan untuk mempermudah user dalam menemukan dokumen web yang
diinginkan dari sejumlah retrieved documents yang dihasilkan search engine.
Teknik ini mengelompokkan dokumen berdasarkan kategori khusus, sehingga
penelusuran user terhadap retrieved documents akan lebih mengerucut.
Salah
satu software pencari atau Web search results clustering yang dapat mengelompokan hasil pencariannya adalah Carrot2. Carrot2 ini
bersifat open source sehingga dapat diperoleh dengan mudah. Software ini Secara
otomatis dapat mengatur
dokumen kategori kecil ke dalam kategori
tematik.
Selain dari dua algoritma clustering dokumen khusus, Carrot2 bisa
digunakan dalam berbagai komponen untuk mengambil
hasil pencarian dari berbagai sumber termasuk GoogleAPI, Bing API, eTools Cari Meta,
Lucene, SOLR, dan lain - lain .
Carrot2 diimplementasikan di Java, tetapi aslinya C # /. NET API juga
tersedia. Non-Java platform, seperti PHP atau Ruby, dapat menghubungi Carrot2
clustering melalui rest interface. Halaman download akan membantu kita untuk
memilih paket yang tepat.
Berikut langkah-langkah untuk menginstall Carrot2.
Sebelum menginstal software ini, sebelumnya kita harus menginstal Java
Runtime Environment (JRE). Setalah itu download
Carrot2 kemudian ekstrak berkasnya dan jalankan carrot.exe yang
berada pada berkas tersebut. Setelah instalasi berhasil, tampilan awal dari Carrot2 adalah sebagai berikut.
Software ini sangat mudah digunakan (user friendly). Kita dapat mengatur sumber dan algoritma yang kita inginkan. Kemudian kita masukan key word yang ingin kita cari.
Carrot2 dilengkapi dengan seperangkat alat dan API yang dapat kita gunakan untuk pengelompokan data kita sendiri dengan cepat, memanggil Carrot2 clustering
dari Java atau C #
kode atau mengakses Carrot2 clustering sebagai remote service.
Carrot2 terdiri dari :
Carrot2 terdiri dari :
-
1. Carrot2 Dokumen Clustering Workbench yang merupakan aplikasi GUI standalone dapat kita gunakan untuk bereksperimen dengan Carrot2 clustering pada data dari mesin pencari umum atau data kita sendiri.2. Carrot2 Java API untuk memanggil Carrot2 pengelompokan dokumen dari kode Java.3. Carrot2 C # API untuk memanggil Carrot2 pengelompokan dokumen dari C # atau. NET kode.4. Carrot2 Dokumen Clustering Server yang menghadapkan Carrot2 clustering sebagai layanan REST.5. Carrot2 Command Line Interface aplikasi yang memungkinkan memanggil Carrot2 clustering dari baris perintah.6. Carrot2 Aplikasi Web yang memperlihatkan Carrot2 clustering sebagai aplikasi web untuk pengguna akhir.