Akuisisi dan Clustering Data Sosial Media Menggunakan Algoritma K-Means sebagai Dasar untuk Mengetahui Profil Pengguna

Binuri Ayu Dwiarni, Budi Setiyono
Submission Date: 2019-08-06 16:34:38
Accepted Date: 2020-01-30 14:08:20

Abstract


Banyaknya informasi yang tersebar melalui sosial media menyebabkan data sosial media menjadi salah satu sumber data yang menarik untuk diteliti. Pada Twitter, hanya 11,84% dari akun protected di Twitter yang berarti sebagian besar tweetnya terlihat dan mudah dibagikan. Twitter menyediakan layanan Application Programming Interface (API) yang dapat digunakan untuk mengakuisisi data. Untuk bisa menjadikan data yang diakuisi tersebut menjadi sebuah informasi yang berguna diperlukan sebuah proses salah satunya dengan clustering. Algoritma K-Means mempunyai kemampuan mengelompokkan data dalam jumlah cukup besar dengan waktu komputasi yang cepat dan efisien. Salah satu budaya asing yang saat ini sedang terkenal di Indonesia yaitu kebudayaan Korea Selatan (Hallyu). Oleh karena itu Hallyu menjadi studi kasus dalam Tugas Akhir ini. Proses Akuisisi Data Twitter dilakukan dengan cara membangun aplikasi Twitter untuk mendapatkan OAuth Twitter kemudian melakukan akuisisi dengan filter fitur-fitur yang disediakan oleh Twitter API. Dari hasil akuisisi data Twitter yang dilakukan dalam 5 hari dengan ujicoba 87 keyword “K-Pop” dan “K-Drama” dengan batasan latitude -4.640003 dan longitude 109.866141 pada radius 590km didapat 68.393 tweet. Hasil akuisisi data tersebut kemudian dilakukan clustering dengan 𝑘 = 3. Dimana 𝑘1 menunjukkan waktu tweet yang dianggap pagi. Sedangkan 𝑘2 menunjukkan waktu tweet yang dianggap siang. Dan 𝑘3 menunjukkan waktu tweet yang dianggap malam. Sehingga setelah melakukan clustering di dapat jam 21.00 – 01.00 merupakan mayoritas orang-orang melakukan tweet.tweet. Hasil akuisisi data tersebut kemudian dilakukan clustering dengan 𝑘 = 3. Dimana 𝑘1 menunjukkan waktu tweet yang dianggap pagi. Sedangkan 𝑘2 menunjukkan waktu tweet yang dianggap siang. Dan 𝑘3 menunjukkan waktu tweet yang dianggap malam. Sehingga setelah melakukan clustering di dapat jam 21.00 – 01.00 merupakan mayoritas orang-orang melakukan tweet.

Keywords


Akuisisi Profil Pengguna; Sosial Media; Twitter API; Algoritma Clustering K-Means; Hallyu

Full Text: PDF

CC Licencing


Authors who publish with this journal agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).

Refbacks

  • There are currently no refbacks.


Creative Commons License
Jurnal Sains dan Seni ITS by Lembaga Penelitian dan Pengabdian Kepada Masyarakat, LPPM-ITS is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Based on a work at https://ejurnal.its.ac.id/index.php/sains_seni.