Implementasi Single Thread dan Multi Thread pada Web Crawling
Submission Date: 2023-08-02 10:06:50
Accepted Date: 2025-02-17 00:00:00
Abstract
Peredaran informasi pada saat ini semakin pesat. Semua informasi dapat dengan mudah diperoleh dari berbagai sumber di internet. Sebagian besar pengguna internet menggunakan mesin pencari dalam memperoleh sebuah informasi. Lebih dari 5 miliar orang di seluruh dunia sekarang menggunakan internet dengan durasi rata-rata online selama 6 jam 53 menit dalam sehari. Sehingga diperlukan mesin pencari yang memiliki kinerja terbaik. Efektivitas mesin pencari tergantung pada web crawler dan teknik crawling yang digunakan untuk memperoleh data yang diinginkan pengguna. Web crawling merupakan elemen penting yang secara otomatis menjelajahi halaman web dan tautan sesuai dengan permintaan pengguna. Web crawling dapat diterapkan secara single thread maupun multi thread. Perbedaan penerapan web crawling ini terdapat pada alur kerja dalam menjelajahi sebuah halaman web yang berkaitan dengan keyword. Single thread akan menjelajahi satu persatu halaman web sehingga dapat lebih cermat pencariannya. Sedangkan multi thread menjelajahi halaman web secara bersamaan dalam satu waktu yang mana akan membutuhkan waktu lebih singkat. Oleh karena itu, penelitian ini bertujuan mengimplementasikan single thread dan multi thread pada web crawling untuk mendapatkan metode terbaik dengan menganalisis kinerjanya. Pada penelitian ini dibuat tiga skenario berkaitan dengan banyaknya kata pada kata kunci. Dimana skenario pertama dengan menggunakan satu kata, skenario kedua menggunakan dua kata, dan skenario ketiga menggunakan tiga kata. Hasil terbaik dalam pada penelitian ini adalah metode Multi Thread yang memiliki kualitas URL sebesar 62,33% dengan kecepatan selama 59,243 s.
Keywords
Search Engine; Web Crawling; Single Thread; Multi Thread
CC Licencing
Authors who publish with this journal agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).
Refbacks
- There are currently no refbacks.

Jurnal Sains dan Seni ITS by Lembaga Penelitian dan Pengabdian Kepada Masyarakat, LPPM-ITS is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Based on a work at https://ejurnal.its.ac.id/index.php/sains_seni.