Analisis Topik Informasi Publik Media Sosial di Surabaya Menggunakan Pemodelan Latent Dirichlet Allocation (LDA)

Kusnanta Bramantya Putra, Renny Pradina Kusumawardani
Submission Date: 2017-07-14 10:19:19
Accepted Date: 2018-01-09 21:27:31

Abstract


Radio Suara Surabaya mengembangkan siaran interaktif berbasis jurnalistik masyarakat, dimana gagasan ini melibatkan partisipasi warga dalam melaporkan peristiwa kepada penyiar radio yang sedang bertugas. Laporan masyarakat yang masuk kemudian disebarluaskan kembali baik melalui siaran radio maupun media social untuk memberikan informasi kepada masyarakat.

Tingginya jumlah laporan perhari yang masuk melalui media social dan beragamnya topik dari laporan tersebut menimbulkan kesulitan dalam mengidentifikasi suatu topik dari kumpulan laporan media social masyarakat dan menghabiskan banyak waktu jika dilakukan secara manual oleh manusia.

Dengan kondisi demikian, dibutuhkan suatu pemodelan topik yang mampu secara otomatis mengklasifikasikan pesan media social ke dalam topik-topik yang muncul dari hasil pemodelan. Pemodelan topik dilakukan dengan metode Latent Dirichlet Allocation (LDA), sebuah metode text mining untuk menemukan pola tertentu pada sebuah dokumen dengan menghasilkan beberapa macam topik yang berbeda. Eksperimen pemodelan topic dengan metode LDA menyimpulkan bahwa jumlah topik yang terdapat dalam pesan media social adalah 4 topik. Hasil eksperimen ini telah diuji secara mesin dan diuji kemudahannya untuk diinterpretasi oleh manusia melalui uji koherensi topik. Kesimpulan dari uji koherensi topik menyatakan bahwa model yang dihasilkan dengan metode LDA pada studi kasus ini dapat diinterpretasi manusia dengan baik.

Keywords


Radio Suara Surabaya, pesan media sosial, Latent Dirichlet Allocation (LDA), uji koherensi topik, word intrusion task, topic intrusion task

References


P. K. Surabaya, "Situs Web Resmi Kota Surabaya," Pemerintah Kota Surabaya, [Online]. Available: http://sparkling.surabaya.go.id/. [Accessed 19 Oktober 2016].

D. I. P. Hadi, "Penyiaran Interaktif dan Kepentingan Publik," 2014.

R. S. Surabaya, "Suara Surabaya Official Website," [Online]. Available: http://www.suarasurabaya.net/. [Accessed 19 Oktober 2016].

D. M. Blei, "Latent Dirichlet Allocation," Machine Learning Research 3, pp. 933-1022, 2003.

J. H. L. K. G. T. B. David Newman, "Automatic Evaluation of Topic Coherence," Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies (ACL HLT 2011), pp. 100-108, 2010.

D. M. Blei, "Probabilistic Topic Model," communications of the acm, vol. 55, 2012.

J. C. Campbell, A. Hindle and a. E. Stroulia, "Latent Dirichlet Allocation: Extracting Topics," 2014.

N. C. T. B. Jey Han Lau, "On-line Trend Analysis with Topic Models: #twitter trends detection topic model online," Proceedings of COLING 2012: Technical Papers, p. 1519–1534, 2012.

A. Gaur, "Topic Models As A Novel Approach To Identify Themes In Content Analysis: The Example Of Organizational Research Methods," 2015.

J.-F. Yeh, Y.-S. Tan and C.-H. Lee, "Topic detection and tracking for conversational content by using conceptual dynamic latent Dirichlet Allocation," Neurocomputing, 2016.

H. Z. Zhou Tong, "A Text Mining Research Based On LDA Topic Modelling," Jodrey School of Computer Science, Acadia University, Wolfville, NS, Canada, vol. 10.5121/csit.2016.60616, p. 201–210, 2016.

H. Tanhana Jukangko, "Peran Radio Suara Surabaya Sebagai Media Pendidikan untuk Tertib Berlalu Lintas bagi Warga Kota Surabaya," Kajian Moral dan Kewarganegaraan, vol. Vol 3 Nomer 1, 2013.

I. P. Hadi, "Khalayak Maya Dalam Media Online," Jurnal Ilmiah SCRIPTURA, vol. 1, 2007.

F. L. Desi Yoanita, "Akurasi dalam Jurnalisma Warga pada Radio Suara Surabaya`," Jurnal SCRIPTURA, vol. 4, pp. 47-53, 2014.

F. Z. Tala, "A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia," Institute for Logic, Language and Computation, Universiteit van Amsterdam, The Netherlands, 2003.

M. Muslich, Garis-garis Besar Tata Bahasa Baku Bahasa Indonesia, Bandung: Refika Aditama, 2010.

A. Chaer, Tata Bahasa Praktis Bahasa Indonesia, Jakarta: Barata Karya Aksara, 2008.

J. H. L. K. G. a. T. B. David Newman, "Automatic Evaluation of Topic Coherence," Human Language Technologies: The 2010 Annual Conference of the North American Chapter of the ACL, p. 100–108, 2010.

P. K. D. A. D. B. Keith Stevens, "Exploring Topic Coherence over many models and many topics," Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, p. 952–961, 2012.

J. B.-G. C. W. S. G. D. M. B. Jonathan Chang, "Reading Tea Leaves: How Humans Interpret Topic Models," in Neural Information Processing Systems, Vancouver, BC, 2009.


Full Text: PDF

CC Licencing


Authors who publish with this journal agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).

Refbacks

  • There are currently no refbacks.


Creative Commons License
Jurnal Teknik ITS by Lembaga Penelitian dan Pengabdian Kepada Masyarakat, LPPM-ITS is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Based on a work at http://ejurnal.its.ac.id/index.php/teknik.
Statistik Pengunjung