IndoBugis 10K - Dataset Kalimat Paralel Bahasa Indonesia Dan Bahasa Bugis

Hak Cipta

IndoBugis 10K - Dataset Kalimat Paralel Bahasa Indonesia Dan Bahasa Bugis

Dataset ini berisi kumpulan kalimat paralel bahasa Indonesia dan bahasa Bugis sejumlah 10.296 kalimat. Dataset ini dapat digunakan untuk riset-riset dalam bidang pemrosesan bahasa alami (natural language processing; NLP). Dataset ini telah diuji melalui pengembangan model mesin penerjemah dengan menggunakan metode LSTM dan Bi-LSTM.


2024-1719796638-mxgf


-

Pusat Riset Sains Data dan Informasi

mted001@brin.go.id

Badan Riset dan Inovasi Nasional

BD - Basis Data

Jakarta

02 Juli 2024

EC002024244160

05 Desember 2024

05 Desember 2024

000816592


  • M. Teduh Uliniansyah
    ( Pusat Riset Sains Data dan Informasi )
  • Yuyun
    ( Pusat Riset Sains Data dan Informasi )
  • Gunarso
    ( Pusat Riset Sains Data dan Informasi )
  • Andi Djalal Latief
    ( Pusat Riset Sains Data dan Informasi )
  • Tri Sampurno
    ( Pusat Riset Sains Data dan Informasi )
  • Elvira Nurfadhilah
    ( Pusat Riset Sains Data dan Informasi )
  • Nuraisa Novia Hidayati
    ( Pusat Riset Sains Data dan Informasi )
  • Siska Pebiana
    ( Pusat Riset Sains Data dan Informasi )
  • Dian Isnaeni Nurul Afra
    ( Pusat Riset Sains Data dan Informasi )
  • Gusnawaty
    ( Universitas Hasanuddin )
  • Pammuda
    ( Universitas Hasanuddin )
  • Mutahharah Nemin Kaharuddin
    ( Universitas Hasanuddin )
  • Ita Rosvita
    ( Universitas Hasanuddin )
  • Nurfaedah Jufri
    ( Universitas Hasanuddin )
  • Zahrani
    ( Universitas Hasanuddin )
  • Munawirah
    ( Universitas Hasanuddin )
  • Hazriani
    ( Universitas Hasanuddin )
Kembali