Dataset Berita Palsu Bahasa Indonesia Dengan Penelusuran Fakta Berbasis LLM

Hak Cipta

Dataset Berita Palsu Bahasa Indonesia Dengan Penelusuran Fakta Berbasis LLM

Dataset ini berisi kumpulan berita palsu (hoax) dan berita valid (real) dalam bahasa Indonesia, yang dapat digunakan sebagai benchmark untuk penelitian terkait. Data dikumpulkan dari situs pelaporan hoaks serta portal berita online Indonesia. Judul berita dari portal online diparafrase agar memiliki karakteristik serupa dengan klaim pada data pelaporan hoaks (Mafindo), dan diberi label sebagai berita valid. Semua klaim telah melalui pemeriksaan fakta kembali dengan bantuan API Bing dan LLM OpenAI. Fakta-fakta disajikan dalam bentuk poin-poin ringkasan. Selain itu, setiap klaim diberi atribusi berupa tone (neutral/not-neutral) dan topik, yang kemudian divalidasi oleh manusia.


2024-1726723728-adbc

B-23552/III.6.3/TK.11.01/9/2024


( Lihat )

Pusat Riset Sains Data dan Informasi

rini.wijayanti@brin.go.id

Badan Riset dan Inovasi Nasional

BD - Basis Data

Bandung

14 Maret 2024

EC002024214047

29 Oktober 2024

29 Oktober 2024

000786479


  • Rini Wijayanti
    ( Pusat Riset Sains Data dan Informasi )
  • Iftitahu Ni'mah
    ( Pusat Riset Sains Data dan Informasi )
  • Agung Santosa
    ( Pusat Riset Sains Data dan Informasi )
  • Asril
    ( Pusat Riset Sains Data dan Informasi )
  • M. Teduh Uliniansyah
    ( Pusat Riset Sains Data dan Informasi )
  • Yuyun
    ( Pusat Riset Sains Data dan Informasi )
  • Purnomo Husnul Khotimah
    ( Pusat Riset Sains Data dan Informasi )
  • Ke Xu
    ( Shenzen University )
Kembali