InaEnviMag - Dataset Sentimen Twitter 50K Mengenai Layanan Publik Pada Bidang Pengelolaan Lingkungan

Hak Cipta

InaEnviMag - Dataset Sentimen Twitter 50K Mengenai Layanan Publik Pada Bidang Pengelolaan Lingkungan

Abstrak: Dataset ini berisi data sentimen terkait pengelolaan lingkungan yang dikumpulkan dari Januari 2020 hingga Maret 2023 melalui Twitter API. Dataset terdiri dari 50.000 tweet yang telah disaring untuk menghapus informasi tidak relevan, bahasa selain Indonesia, spam, dan duplikat. Sentimen dibagi menjadi tiga kelas: positif, negatif, dan netral. Proses pemberian label sentimen melibatkan tiga model: ChatGPT, Model Indobert Tweet, dan Transformer. Sentimen akhir pada setiap tweet ditentukan berdasarkan hasil yang paling sering muncul. Dataset ini dibuat dengan mengumpulkan data menggunakan keyword terkait isu pengelolaan lingkungan yang populer di Twitter. Data ini memberikan wawasan mengenai pandangan publik dan berpotensi menjadi panduan untuk pengembangan kebijakan publik. Ketersediaan dataset ini mendukung penelitian sentiment analisis, persepsi publik, dan pengambilan keputusan terkait pengelolaan lingkungan. Proses pelabelan melibatkan tiga teknik: ChatGPT, Indobert Tweet, dan RoBerta, dengan label sentimen ditentukan berdasarkan hasil yang paling sering muncul. Dataset ini telah dihapuskan dari bahasa daerah, bahasa asing, dan tweet tidak relevan, serta tidak mengandung duplikat konten.


2023-1693383505-h5jx

B-7581/III.6.3/TK.11.01/10/2023


( Lihat )

Pusat Riset Sains Data dan Informasi

radh001@brin.go.id

Badan Riset dan Inovasi Nasional

BD - Basis Data

Jakarta

25 Agustus 2023

EC002023112269

15 November 2023

15 November 2023

000545224


  • Radhiyatul Fajri
    ( Pusat Riset Sains Data dan Informasi )
  • M. Teduh Uliniansyah
    ( Pusat Riset Sains Data dan Informasi )
  • Elvira Nurfadhilah
    ( Pusat Riset Sains Data dan Informasi )
  • Siska Pebiana
    ( Pusat Riset Sains Data dan Informasi )
  • Agung Santosa
    ( Pusat Riset Sains Data dan Informasi )
  • Nuraisa Novia Hidayati
    ( Pusat Riset Sains Data dan Informasi )
  • Hammam Riza
    ( Pusat Riset Kecerdasan Artifisial dan Keamanan Siber )
  • Gunarso
    ( Pusat Riset Sains Data dan Informasi )
  • Andi Djalal Latief
    ( Pusat Riset Sains Data dan Informasi )
  • Dian Isnaeni Nurul Afra
    ( Pusat Riset Sains Data dan Informasi )
  • Siti Shaleha
    ( Pusat Riset Sains Data dan Informasi )
  • Tri Sampurno
    ( Pusat Riset Sains Data dan Informasi )
  • Yuyun
    ( Pusat Riset Sains Data dan Informasi )
  • Asril
    ( Pusat Riset Sains Data dan Informasi )
  • Indra Budi
    ( Fakultas Ilmu Komputer Universitas Indonesia )
  • Meganingrum Arista Jiwanggi
    ( Fakultas Ilmu Komputer Universitas Indonesia )
  • Ryan Randy Suryono
    ( Fakultas Ilmu Komputer Universitas Indonesia )
  • Tosan Wiar Ramdhani
    ( Fakultas Ilmu Komputer Universitas Indonesia )
  • M Irfan Raif
    ( Universitas Maritim Raja Ali Haji )
  • Tri Nanda
    ( Universitas Maritim Raja Ali Haji )
Kembali