Bangkit-TS (Pembangkit Teks Berbasis Sinonim untuk Pembelajaran CNN dan LSTM)
Hak Cipta
Bangkit-TS (Pembangkit Teks Berbasis Sinonim untuk Pembelajaran CNN dan LSTM)
Masalah ketidakseimbangan data sering ditemui dalam proses pelatihan model deep learning ketika melakukan klasifikasi. Ketidakseimbangan data dapat menyebabkan bias terhadap kelas mayoritas. Restrukturisasi data perlu dilakukan, salah satunya dengan cara oversampling. Bangkit-TS berfungsi untuk menghasilkan data teks secara otomatis berbasis sinonim yang dapat dimanfaatkan untuk merestrukturisasi dataset pada proses oversampling. Bangkit-TS dapat menghasilkan n data teks baru dari sebuah data tekstual. Metode yang digunakan adalah melakukan substitusi n-kata sinonim pada sebuah data tekstual. n-kata dipilih secara acak untuk kemudian diganti dengan padanan katanya dari kamus Bahasa Indonesia yang ada di Internet menggunakan Pustaka Kateglo API. Fungsi pengembangan model, hyperparameter tuning dan validasi/evaluasi model pengklasifikasi teks biner juga disertakan pada aplikasi Bangkit-TS.
2022-1668420261-fvrr
B-4381/III.6.3/HK.06/11/2022
Pusat Riset Sains Data dan Informasi
hkhotimah.work@gmail.com
Badan Riset dan Inovasi Nasional
SF - Perangkat Lunak
Bandung, Indonesia
31 Maret 2022
EC002022107186
15 Desember 2022
15 Desember 2022
000422930
- Purnomo Husnul Khotimah
( Pusat Riset Sains Data dan Informasi ) - Andri Fachrur Rozie
( Pusat Riset Sains Data dan Informasi ) - Andria Arisal
( Pusat Riset Sains Data dan Informasi )
- Febi Siti Sutria Ningsih
( Jurusan Matematika FMIPA, Universitas Lampung ) - Dian Kurniasari
( Jurusan Matematika FMIPA, Universitas Lampung ) - Warsono
( Jurusan Matematika FMIPA, Universitas Lampung )