PENANGANAN KETIDAKSEIMBANGAN DATA PADA KLASIFIKASI PENGADUAN MASYARAKAT
Article Sidebar
Download : 245
Main Article Content
Abstract
Pengaduan masyarakat memiliki peran penting dalam meningkatkan kualitas layanan lembaga. Namun, dalam pengolahan data pengaduan, sering terjadi ketidakseimbangan dimana jumlah pengaduan setiap kelas tidak seimbang. Penelitian ini bertujuan mengatasi ketidakseimbangan data dalam klasifikasi pengaduan dengan menggunakan data pengaduan masyarakat Kota Denpasar. Ketidakseimbangan data dapat berdampak negatif pada klasifikasi, model cenderung menjadi bias terhadap kelas mayoritas. Untuk mengatasinya dapat menggunakan model oversampling menggunakan teknik SMOTE (Synthetic Minority Over-sampling Technique) dan ADASYN (Adaptive Synthetic Sampling). SMOTE dan ADASYN digunakan untuk menghasilkan sampel sintetis dari kelas minoritas dalam dataset. Klasifikasi menggunakan NBC (Naive Bayes Classifier), SVM (Support Vector Machine), dan random forest. Untuk mengevaluasi performa model, digunakan matriks evaluasi akurasi, presisi, recall, dan F1-Score. Evaluasi membantu dalam memahami sejauh mana model-model dapat mengklasifikasikan pengaduan masyarakat dengan tepat, terutama dalam ketidakseimbangan data. Selain matriks evaluasi, juga dihitung waktu dari setiap model untuk mengetahui waktu proses yang dibutuhkan oleh model. Hasil menunjukkan penggunaan SMOTE dan ADASYN meningkatkan nilai akurasi pada algoritma SVM dan random forest. Namun, algoritma NBC, penggunaan model sampling justru menurunkan akurasi, waktu proses juga menjadi faktor penting dalam pemilihan algoritma. SVM memiliki waktu proses yang paling lama, NBC memiliki waktu proses yang paling pendek, dan random forest berada di antara keduanya.
Article Details
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
References
F. Abdulloh, A. Aminuddin, M. Rahardi, and S. Anggita, “Observation of Imbalance Tracer Study Data for Graduates Employability Prediction in Indonesia,” International Journal of Advanced Computer Science and Applications, vol. 13, pp. 169–174, Sep. 2022, doi: 10.14569/IJACSA.2022.0130820.
E. M. O. N. Haryanto, A. K. A. Estetikha, and R. A. Setiawan, “IMPLEMENTASI SMOTE UNTUK MENGATASI IMBALANCED DATA PADA SENTIMEN ANALISIS SENTIMEN HOTEL DI NUSA TENGGARA BARAT DENGAN MENGGUNAKAN ALGORITMA SVM,” Informasi Interaktif, vol. 7, no. 1, Art. no. 1, Jan. 2022.
F. Last, G. Douzas, and F. Bacao, “Oversampling for Imbalanced Learning Based on K-Means and SMOTE,” Information Sciences, vol. 465, pp. 1–20, Oct. 2018, doi: 10.1016/j.ins.2018.06.056.
R. Ardianto, T. Rivanie, Y. Alkhalifi, F. S. Nugraha, and W. Gata, “SENTIMENT ANALYSIS ON E-SPORTS FOR EDUCATION CURRICULUM USING NAIVE BAYES AND SUPPORT VECTOR MACHINE,” Jurnal Ilmu Komputer dan Informasi, vol. 13, no. 2, pp. 109–122, Jul. 2020, doi: 10.21609/jiki.v13i2.885.
V. A. Fitri, R. Andreswari, and M. A. Hasibuan, “Sentiment Analysis of Social Media Twitter with Case of Anti-LGBT Campaign in Indonesia using Naïve Bayes, Decision Tree, and Random Forest Algorithm,” Procedia Computer Science, vol. 161, pp. 765–772, Jan. 2019, doi: 10.1016/j.procs.2019.11.181.
“Pro Denpasar.” https://pengaduan.denpasarkota.go.id/ (accessed Apr. 17, 2023).
V. I. Santoso, G. Virginia, and Y. Lukito, “Penerapan Sentiment Analysis Pada Hasil Evaluasi Dosen Dengan Metode Support Vector Machine,” Jurnal Transformatika, vol. 14, no. 2, p. 72, Jan. 2017, doi: 10.26623/transformatika.v14i2.439.
komang dharmendra, K. O. Saputra, and I. N. Pramaita, “Analisa Sentiment Untuk Opini Alumni Perguruan Tinggi,” Majalah Ilmiah Teknologi Elektro, vol. 18, no. 2, pp. xxxx–xxxx, Jul. 2019, doi: 10.24843/MITE.2019.V18I02.P11.
I. M. A. Agastya, “Pengaruh Stemmer Bahasa Indonesia Terhadap Peforma Analisis Sentimen Terjemahan Ulasan Film,” Jurnal Tekno Kompak, vol. 12, no. 1, pp. 18–23, Feb. 2018, doi: 10.33365/JTK.V12I1.70.
I. K. Dharmendra, N. N. U. Januhari, I. P. Ramayasa, and I. M. A. W. Putra, “Uji Komparasi Sentiment Analysis Pada Opini Alumni Terhadap Perguruan Tinggi,” Jurnal Teknik Informatika UNIKA Santo Thomas, pp. 1–6, May 2022, doi: 10.54367/jtiust.v7i1.1748.
M. P. Simatupang and D. P. Utomo, “ANALISA TESTIMONIAL DENGAN MENGGUNAKAN ALGORITMA TEXT MINING DAN TERM FREQUENCY- INVERSE DOCUMENT FREQUENCE (TF-IDF) PADA TOKO ALLMEEART,” KOMIK (Konferensi Nasional Teknologi Informasi dan Komputer), vol. 3, no. 1, Art. no. 1, Dec. 2019, doi: 10.30865/komik.v3i1.1697.
U. Krzeszewska, A. Poniszewska-Marańda, and J. Ochelska-Mierzejewska, “Systematic Comparison of Vectorization Methods in Classification Context,” Applied Sciences, vol. 12, no. 10, Art. no. 10, Jan. 2022, doi: 10.3390/app12105119.
F. C. Kasih, A. Puspaningrum, and A. Ghozali, “RANCANG BANGUN APLIKASI WEB UNTUK ANALISIS SENTIMEN PENGGUNA TWITTER TERHADAP KINERJA PEMERINTAH PROVINSI JAWA BARAT MENGGUNAKAN NAIVE BAYES CLASSIFIER,” SEMINAR TEKNOLOGI TERAPAN, vol. 1, no. 1, Art. no. 1, 2021, Accessed: Jun. 20, 2023. [Online]. Available: https://prosiding.polindra.ac.id/index.php/semitera/article/view/149-157
B. B. Baskoro, I. Susanto, and S. Khomsah, “Analisis Sentimen Pelanggan Hotel di Purwokerto Menggunakan Metode Random Forest dan TF-IDF (Studi Kasus: Ulasan Pelanggan Pada Situs TRIPADVISOR),” INISTA (Journal of Informatics Information System Software Engineering and Applications), vol. 3, no. 2, Art. no. 2, Jun. 2021, doi: 10.20895/inista.v3i2.218.
M. Umer et al., “Scientific papers citation analysis using textual features and SMOTE resampling techniques,” Pattern Recognition Letters, vol. 150, pp. 250–257, Oct. 2021, doi: 10.1016/j.patrec.2021.07.009.
R. Wati and S. Ernawati, “Analisis Sentimen Persepsi Publik Mengenai PPKM Pada Twitter Berbasis SVM Menggunakan Python,” Jurnal Teknik Informatika UNIKA Santo Thomas, pp. 240–247, Nov. 2021, doi: 10.54367/JTIUST.V6I2.1465.
R. Moraes, J. F. Valiati, and W. P. Gavião Neto, “Document-level sentiment classification: An empirical comparison between SVM and ANN,” Expert Systems with Applications, vol. 40, no. 2, pp. 621–633, Feb. 2013, doi: 10.1016/J.ESWA.2012.07.059.
T. Desyani, A. Saifudin, and Y. Yulianti, “Feature Selection Based on Naive Bayes for Caesarean Section Prediction,” IOP Conf. Ser.: Mater. Sci. Eng., vol. 879, no. 1, p. 012091, Jul. 2020, doi: 10.1088/1757-899X/879/1/012091.