Dataset Berita Palsu Bahasa Indonesia Dengan Penelusuran Fakta Berbasis LLM
Hak Cipta
Dataset Berita Palsu Bahasa Indonesia Dengan Penelusuran Fakta Berbasis LLM
Dataset ini berisi kumpulan berita palsu (hoax) dan berita valid (real) dalam bahasa Indonesia, yang dapat digunakan sebagai benchmark untuk penelitian terkait. Data dikumpulkan dari situs pelaporan hoaks serta portal berita online Indonesia. Judul berita dari portal online diparafrase agar memiliki karakteristik serupa dengan klaim pada data pelaporan hoaks (Mafindo), dan diberi label sebagai berita valid. Semua klaim telah melalui pemeriksaan fakta kembali dengan bantuan API Bing dan LLM OpenAI. Fakta-fakta disajikan dalam bentuk poin-poin ringkasan. Selain itu, setiap klaim diberi atribusi berupa tone (neutral/not-neutral) dan topik, yang kemudian divalidasi oleh manusia.
2024-1726723728-adbc
B-23552/III.6.3/TK.11.01/9/2024
Pusat Riset Sains Data dan Informasi
rini.wijayanti@brin.go.id
Badan Riset dan Inovasi Nasional
BD - Basis Data
Bandung
14 Maret 2024
EC002024214047
29 Oktober 2024
29 Oktober 2024
000786479
- Rini Wijayanti
( Pusat Riset Sains Data dan Informasi ) - Iftitahu Ni'mah
( Pusat Riset Sains Data dan Informasi ) - Agung Santosa
( Pusat Riset Sains Data dan Informasi ) - Asril
( Pusat Riset Sains Data dan Informasi ) - M. Teduh Uliniansyah
( Pusat Riset Sains Data dan Informasi ) - Yuyun
( Pusat Riset Sains Data dan Informasi ) - Purnomo Husnul Khotimah
( Pusat Riset Sains Data dan Informasi )
- Ke Xu
( Shenzen University )