KLASIFIKASI EMOSI PADA TWEET BERBAHASA INDONESIA MENGGUNAKAN TEKNIK SAMPLING ENN

Main Article Content

I Gede Harsemadi
I Komang Dharmendra
I Made Pasek Pradnyana Wijaya

Abstract

Twitter menjadi fokus utama sebagai platform media sosial yang sangat populer di seluruh dunia, dengan pertumbuhan data yang terus meningkat setiap hari. Potensinya untuk aplikasi analisis sentimen dan deteksi emosi dari tweet sangat besar. Namun, tantangan muncul karena dataset tweet sering kali tidak seimbang antara kelas emosi. Oleh karena itu, penelitian ini menguji empat algoritma klasifikasi yang berbeda dengan menggunakan teknik sampling Edited Nearest Neighbours (ENN) pada dataset tweet berbahasa Indonesia yang tidak seimbang dengan lima kelas emosi. Hasil evaluasi mengungkapkan bahwa model RandomForest memiliki akurasi tertinggi sekitar 62.55%, sementara Neural Network mendominasi dalam presisi dengan nilai 67.23%. Meskipun model SVM memiliki presisi yang tinggi, recall dan F1-score yang rendah menunjukkan keterbatasan dalam mengidentifikasi kelas positif dengan benar. Oleh karena itu, penggunaan ENN untuk mengatasi ketidakseimbangan data pada dataset tweet berbahasa Indonesia memperlihatkan bahwa model RandomForest dan Neural Network adalah pilihan yang lebih baik dalam tugas klasifikasi emosi.

Article Details

How to Cite
I Gede Harsemadi, I Komang Dharmendra, & I Made Pasek Pradnyana Wijaya. (2023). KLASIFIKASI EMOSI PADA TWEET BERBAHASA INDONESIA MENGGUNAKAN TEKNIK SAMPLING ENN. Jurnal Teknologi Informasi Dan Komputer, 9(5). Retrieved from https://jurnal.undhirabali.ac.id/index.php/jutik/article/view/2646
Section
Articles

References

I. M. D. Ardiada, M. Sudarma, and D. Giriantari, ‘Text Mining pada Sosial Media untuk Mendeteksi Emosi Pengguna Menggunakan Metode Support Vector Machine dan K-Nearest Neighbour’, Maj. Ilm. Teknol. Elektro, vol. 18, no. 1, p. 55, May 2019, doi: 10.24843/mite.2019.v18i01.p08.

F. A. Acheampong, C. Wenyu, and H. Nunoo-Mensah, ‘Text-based emotion detection: Advances, challenges, and opportunities’, Eng. Rep., vol. 2, no. 7, p. e12189, 2020, doi: 10.1002/eng2.12189.

I. D. Abirawa, A. B. Osmond, and C. Setianingsih, ‘Klasifikasi Emosi Pada Lirik Lagu Menggunakan Metode Support Vector Machine’, EProceedings Eng., vol. 5, no. 3, Art. no. 3, Dec. 2018, Accessed: Dec. 04, 2022. [Online]. Available: https://openlibrarypublications.telkomuniversity.ac.id/index.php/engineering/article/view/8007

P. Kumar and B. Raman, ‘A BERT based dual-channel explainable text emotion recognition system’, Neural Netw., vol. 150, pp. 392–407, Jun. 2022, doi: 10.1016/j.neunet.2022.03.017.

V. A. Fitri, R. Andreswari, and M. A. Hasibuan, ‘Sentiment Analysis of Social Media Twitter with Case of Anti-LGBT Campaign in Indonesia using Naïve Bayes, Decision Tree, and Random Forest Algorithm’, Procedia Comput. Sci., vol. 161, pp. 765–772, Jan. 2019, doi: 10.1016/j.procs.2019.11.181.

F. Abdulloh, A. Aminuddin, M. Rahardi, and S. Anggita, ‘Observation of Imbalance Tracer Study Data for Graduates Employability Prediction in Indonesia’, Int. J. Adv. Comput. Sci. Appl., vol. 13, pp. 169–174, Sep. 2022, doi: 10.14569/IJACSA.2022.0130820.

A. Nurhopipah and C. Magnolia, ‘PERBANDINGAN METODE RESAMPLING PADA IMBALANCED DATASET UNTUK KLASIFIKASI KOMENTAR PROGRAM MBKM’, J. Publ. Ilmu Komput. Dan Multimed., vol. 2, no. 1, Art. no. 1, Jan. 2023, doi: 10.55606/jupikom.v2i1.862.

I. Triguero, D. García-Gil, J. Maillo, J. Luengo, S. García, and F. Herrera, ‘Transforming big data into smart data: An insight on the use of the k-nearest neighbors algorithm to obtain quality data’, WIREs Data Min. Knowl. Discov., vol. 9, no. 2, p. e1289, 2019, doi: 10.1002/widm.1289.

Yennimar -, A. Rasid, and S. Kenedy, ‘IMPLEMENTATION OF SUPPORT VECTOR MACHINE ALGORITHM WITH HYPER-TUNING RANDOMIZED SEARCH IN STROKE PREDICTION’, J. Sist. Inf. Dan Ilmu Komput. PrimaJUSIKOM PRIMA, vol. 6, no. 2, Art. no. 2, Mar. 2023, doi: 10.34012/jurnalsisteminformasidanilmukomputer.v6i2.3479.

A. Onan, ‘Sentiment analysis on product reviews based on weighted word embeddings and deep neural networks’, Concurr. Comput. Pract. Exp., vol. 33, no. 23, p. e5909, 2021, doi: 10.1002/cpe.5909.

E. M. O. N. Haryanto, A. K. A. Estetikha, and R. A. Setiawan, ‘IMPLEMENTASI SMOTE UNTUK MENGATASI IMBALANCED DATA PADA SENTIMEN ANALISIS SENTIMEN HOTEL DI NUSA TENGGARA BARAT DENGAN MENGGUNAKAN ALGORITMA SVM’, Inf. Interaktif, vol. 7, no. 1, Art. no. 1, Jan. 2022.

M. S. Saputri, R. Mahendra, and M. Adriani, ‘Emotion Classification on Indonesian Twitter Dataset’, in 2018 International Conference on Asian Language Processing (IALP), Nov. 2018, pp. 90–95. doi: 10.1109/IALP.2018.8629262.

S. M. Chamzah, M. Lestandy, N. Kasan, and A. Nugraha, ‘Penerapan Synthetic Minority Oversampling Technique (SMOTE) untuk Imbalance Class pada Data Text Menggunakan kNN’, Syntax J. Inform., vol. 11, no. 02, Art. no. 02, Nov. 2022, doi: 10.35706/syji.v11i02.6940.

B. B. Baskoro, I. Susanto, and S. Khomsah, ‘Analisis Sentimen Pelanggan Hotel di Purwokerto Menggunakan Metode Random Forest dan TF-IDF (Studi Kasus: Ulasan Pelanggan Pada Situs TRIPADVISOR)’, INISTA J. Inform. Inf. Syst. Softw. Eng. Appl., vol. 3, no. 2, Art. no. 2, Jun. 2021, doi: 10.20895/inista.v3i2.218