Text Mining pada Media Sosial Twitter Studi Kasus: Masa Tenang Pilkada DKI 2017 Putaran 2

Image credit: Unsplash

Abstract

Sebanyak 20.000 data tweet diambil pada 15-19 April 2017 selama pelaksanan Pilkada DKI Putaran 2. Kemudian data tersebut direduksi dengan menggunakan langkah preprocessing serta menghapus data dengan nilai TD-TDF yang rendah. Kemudian sentimen diberikan kepada data dengan menghitung jumlah kata positif dan negatif yang telah definisikan oleh peneliti berdasarkan observasi terhadap beberapa sampel data yang diambil secara acak. Kami menemukan bahwa terdapat ledakan tweet bersentimen negatif pada hari kedua masa tenang. Sedangkan ledakan selanjutnya terjadi pada hari ketiga, namun pada sentimen positif. Temuan kami yang lain yaitu ‘ahok’ selalu mendapatkan sentimen negatif lebih tinggi dan sentimen positif lebih rendah dari pada tweet ‘anies’. Hasil temuan ini ternyata sejalan dengan hasil pemilihan, yaitu kemenangan pada pasangan Anies-Sandi. Selain itu pada metode-metode unsupervised learning kami menemukan bahwa metode k-means tidak dapat memberikan hasil yang merata pada setiap kelompoknya. Sebaliknya, hasil luaran dari pemodelan topik (topic modeling – Latent Dirichlet Allocation) lebih merata. Selain itu hasil pengelompokkan dari metode k-means dan topic modeling pada data tanggal 18 April 2017 memiliki nilai SSE (k-means) dan marginal likelihood (topic model) yang lebih baik dari pada data tanggal lainnya. Hal ini disebabkan oleh karena keragaman data yang terdapat pada tanggal 18 April 2017 tersebut lebih rendah.

Publication
In Seminar Nasional Matematika dan Aplikasinya Tahun 2017
Click the Cite button above to demo the feature to enable visitors to import publication metadata into their reference management software.
Create your slides in Markdown - click the Slides button to check out the example.

Add the publication’s full text or supplementary notes here. You can use rich formatting such as including code, math, and images.

Dimas BC Wicaksono
Dimas BC Wicaksono
Dosen Biostatistika

Bidang penelitian saya ialah Statistika Terapan, Data Science, dan Machine Learning

Please Subscribe!