IndoBugis 10K - Dataset Kalimat Paralel Bahasa Indonesia Dan Bahasa Bugis
Hak Cipta
IndoBugis 10K - Dataset Kalimat Paralel Bahasa Indonesia Dan Bahasa Bugis
Dataset ini berisi kumpulan kalimat paralel bahasa Indonesia dan bahasa Bugis sejumlah 10.296 kalimat. Dataset ini dapat digunakan untuk riset-riset dalam bidang pemrosesan bahasa alami (natural language processing; NLP). Dataset ini telah diuji melalui pengembangan model mesin penerjemah dengan menggunakan metode LSTM dan Bi-LSTM.
2024-1719796638-mxgf
-
Pusat Riset Sains Data dan Informasi
mted001@brin.go.id
Badan Riset dan Inovasi Nasional
BD - Basis Data
Jakarta
02 Juli 2024
EC002024244160
05 Desember 2024
05 Desember 2024
000816592
- M. Teduh Uliniansyah
( Pusat Riset Sains Data dan Informasi ) - Yuyun
( Pusat Riset Sains Data dan Informasi ) - Gunarso
( Pusat Riset Sains Data dan Informasi ) - Andi Djalal Latief
( Pusat Riset Sains Data dan Informasi ) - Tri Sampurno
( Pusat Riset Sains Data dan Informasi ) - Elvira Nurfadhilah
( Pusat Riset Sains Data dan Informasi ) - Nuraisa Novia Hidayati
( Pusat Riset Sains Data dan Informasi ) - Siska Pebiana
( Pusat Riset Sains Data dan Informasi ) - Dian Isnaeni Nurul Afra
( Pusat Riset Sains Data dan Informasi )
- Gusnawaty
( Universitas Hasanuddin ) - Pammuda
( Universitas Hasanuddin ) - Mutahharah Nemin Kaharuddin
( Universitas Hasanuddin ) - Ita Rosvita
( Universitas Hasanuddin ) - Nurfaedah Jufri
( Universitas Hasanuddin ) - Zahrani
( Universitas Hasanuddin ) - Munawirah
( Universitas Hasanuddin ) - Hazriani
( Universitas Hasanuddin )