Topic Discovery pada Jurnal-Jurnal Penelitian di IEEE Explore Menggunakan Association Rule Mining dengan Pendekatan Closed Frequent Itemset

Reza Mustofa, Irhamah Irhamah
Submission Date: 2019-07-20 07:56:10
Accepted Date: 2020-02-04 00:00:00

Abstract


Menemukan topik dari koleksi dokumen seperti publikasi ilmiah mempunyai banyak manfaat. Dengan semakin banyaknya dokumen teks yang dihasilkan di web dan arsip-arsip digital, Topic Discovery menjadi alat yang sangat penting untuk menelusuri, meringkas, dan mengelompokkan dokumen. Salah satu penerapan Association Rule Mining adalah digunakan untuk menemukan topik dalam suatu dokumen dengan cara mencari pola yang sering muncul pada semua dokumen. Data diambil dari IEEE Xplore yang merupakan kumpulan abstrak dari jurnal-jurnal di International Conference on Data Mining (ICDM) dan International Conference on Data Engineers (ICDE) dari tahun 2009-2018. Masing-masing abstrak direpresentasikan sebagai transaksi sedangkan kata keywords yang terkandung didalamnya direpresentasikan sebagai item. Kombinasi antar kata keywords yang paling sering muncul, yang disebut frequent itemset, akan digunakan sebagai kandidat dari suatu topik. Algoritma yang dapat digunakan untuk membangkitkan itemset adalah algoritma Apriori dan ECLAT. Waktu eksekusi perolehan frequent itemset dari ECLAT lebih cepat bila dibandingkan dengan Apriori. Closed frequent itemset juga mampu mengurangi frequent itemset yang terbentuk, sehingga Topik yang terbentuk merupakan Topik yang unik.


Keywords


Apriori Algorithm; Association Rule; Closed Frequent Itemset; Eclat Algorithm; Network Analysis; Text Mining

Full Text: PDF

CC Licencing


Authors who publish with this journal agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).

Refbacks

  • There are currently no refbacks.


Creative Commons License
Jurnal Sains dan Seni ITS by Lembaga Penelitian dan Pengabdian Kepada Masyarakat, LPPM-ITS is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Based on a work at http://ejurnal.its.ac.id/index.php/sains_seni.