IndoMakassar 9K - Dataset Kalimat Paralel Bahasa Indonesia Dan Bahasa Makassar
Hak Cipta
IndoMakassar 9K - Dataset Kalimat Paralel Bahasa Indonesia Dan Bahasa Makassar
Dataset paralel korpus ini berisi kumpulan kalimat yang terdiri dari teks-teks dalam bahasa Makassar dan bahasa Indonesia yang saling berkorespondensi. Dataset ini berisi 9.165 kalimat paralel bahasa Makassar dan bahasa Indonesia. Dataset ini dapat digunakan pada pengembangan mesin penerjemah (machine translation) yang berfokus pada bahasa dengan sumber daya yang rendah (low-resource language). Dataset ini memiliki urgensi dan kepentingan yang signifikan di antaranya untuk mendokumentasikan dan melestarikan bahasa Makassar sebagai upaya pencegahan dari kepunahan, meningkatkan aksesibilitas yang lebih luas kepada penutur bahasa dengan sumber daya terbatas, preservasi warisan budaya, dan mendorong penelitian lebih lanjut di bidang linguistik.
2024-1719302465-k5bw
B-29939/III.6.3/TK.11.01/11/2024
Pusat Riset Sains Data dan Informasi
dian059@brin.go.id
Badan Riset dan Inovasi Nasional
BD - Basis Data
Bandung
25 Juni 2024
EC002024244148
05 Desember 2024
05 Desember 2024
000816580
- Dian Isnaeni Nurul Afra
( Pusat Riset Sains Data dan Informasi ) - M. Teduh Uliniansyah
( Pusat Riset Sains Data dan Informasi ) - Andi Djalal Latief
( Pusat Riset Sains Data dan Informasi ) - Yuyun
( Pusat Riset Sains Data dan Informasi ) - Elvira Nurfadhilah
( Pusat Riset Sains Data dan Informasi ) - Gunarso
( Pusat Riset Sains Data dan Informasi ) - Tri Sampurno
( Pusat Riset Sains Data dan Informasi )
- Nasrullah
( Universitas Handayani Makassar ) - Najirah Umar
( Universitas Handayani Makassar ) - Abdul Latief Arda
( Universitas Handayani Makassar ) - Abdul Jalil
( Universitas Handayani Makassar ) - Muhammad Risal
( Universitas Handayani Makassar ) - Sitti Zuhriyah
( Universitas Handayani Makassar )