Bangkit-TS (Pembangkit Teks Berbasis Sinonim untuk Pembelajaran CNN dan LSTM)

Hak Cipta

Bangkit-TS (Pembangkit Teks Berbasis Sinonim untuk Pembelajaran CNN dan LSTM)

Masalah ketidakseimbangan data sering ditemui dalam proses pelatihan model deep learning ketika melakukan klasifikasi. Ketidakseimbangan data dapat menyebabkan bias terhadap kelas mayoritas. Restrukturisasi data perlu dilakukan, salah satunya dengan cara oversampling. Bangkit-TS berfungsi untuk menghasilkan data teks secara otomatis berbasis sinonim yang dapat dimanfaatkan untuk merestrukturisasi dataset pada proses oversampling. Bangkit-TS dapat menghasilkan n data teks baru dari sebuah data tekstual. Metode yang digunakan adalah melakukan substitusi n-kata sinonim pada sebuah data tekstual. n-kata dipilih secara acak untuk kemudian diganti dengan padanan katanya dari kamus Bahasa Indonesia yang ada di Internet menggunakan Pustaka Kateglo API. Fungsi pengembangan model, hyperparameter tuning dan validasi/evaluasi model pengklasifikasi teks biner juga disertakan pada aplikasi Bangkit-TS.


2022-1668420261-fvrr

B-4381/III.6.3/HK.06/11/2022


( Lihat )

Pusat Riset Sains Data dan Informasi

hkhotimah.work@gmail.com

Badan Riset dan Inovasi Nasional

SF - Perangkat Lunak

Bandung, Indonesia

31 Maret 2022

EC002022107186

15 Desember 2022

15 Desember 2022

000422930


  • Purnomo Husnul Khotimah
    ( Pusat Riset Sains Data dan Informasi )
  • Andri Fachrur Rozie
    ( Pusat Riset Sains Data dan Informasi )
  • Andria Arisal
    ( Pusat Riset Sains Data dan Informasi )
  • Febi Siti Sutria Ningsih
    ( Jurusan Matematika FMIPA, Universitas Lampung )
  • Dian Kurniasari
    ( Jurusan Matematika FMIPA, Universitas Lampung )
  • Warsono
    ( Jurusan Matematika FMIPA, Universitas Lampung )
Kembali