IMPLEMENTASI PERINGKAS DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN METODE TEXT TO TEXT TRANSFER TRANSFORMER (T5)
DOI:
https://doi.org/10.36002/jutik.v9i4.2531Keywords:
Peringkas, dokumen, T5, Bahasa Indonesia, ROUGEAbstract
Dengan banyaknya informasi yang terdapat pada sebuah berita digital, membuat pembaca terkadang
mengalami kesulitan untuk mengetahui intisari dari kumpulan teks ini. Untuk itu dibutuhkan sebuah
sistem yang bisa meringkas berita digital berbahasa Indonesia secara otomatis. Peringkasan dokumen
adalah proses mengambil teks dari sebuah dokumen, menggali dan menyajikan informasi penting bagi
user atau aplikasi dalam bentuk rangkuman yang singkat dan padat. Ketika kita dihadapkan pada struktur
bahasa yang cukup kompleks, seperti pada Bahasa manusia, kemudian menangkap ide dan makna utama
teks asli. Disinilah digunakan model Transformer yang merupakan model peringkas yang berkinerja
tinggi. T5 merupakan contoh model transformer abstraktif yang menulis ulang kembali kalimatnya
daripada hanya mengambil kalimat langsung dari teks aslinya. Pada penelitian ini dilakukan proses
peringkasan dokumen berita berbahasa Indonesia dengan metode transformer T5. Penelitian ini
dikerjakan dengan tiga skenario. Bagian yang membedakan masing-masing skenario adalah pada bagian
preprocessing katanya. Pada skenario 1 diimplementasikan stemming dan stopwords removal, pada
skenario 2 diimplementasikan stemming tanpa stopwords removal, dan pada skenario 3 tidak
diimplementasikan keduanya. Adapun kesimpulan yang dapat diambil pada penelitian ini adalah
pengujian terbaik yang didapatkan adalah pengujian dengan skenario 2, yaitu dengan
mengimplementasikan stemming tanpa stopwords removal dengan nilai evaluasi ROUGE-1 0.17568.
References
P. Studi, T. Informatika, J. I.
Komputer, F. Matematika, D.
Ilmu, and P. Alam,
“PERINGKASAN TEKS
OTOMATIS UNTUK
DOKUMEN BAHASA BALI
BERBASIS METODE
EKTRAKTIF I Putu Gede Hendra
Suputra,” 2017.
W. Budiyono and F. Solihin,
“APLIKASI PERINGKAS
BERITA ONLINE OTOMATIS
MENGGUNAKAN METODE
ORDINARY WEIGHTING
PADA SITUS PENGUMPUL
BERITA,” 2014.
M. A. Zamzam, “SISTEM
AUTOMATIC TEXT
SUMMARIZATION
MENGGUNAKAN
ALGORITMA TEXTRANK,”
MATICS, vol. 12, no. 2, pp. 111–
, Sep. 2020, doi:
18860/mat.v12i2.8372.
R. Adelia, S. Suyanto, and U. N.
Wisesty, “Indonesian abstractive
text summarization using
bidirectional gated recurrent unit,”
in Procedia Computer Science,
Elsevier B.V., 2019, pp. 581–588.
doi: 10.1016/j.procs.2019.09.017.
Kulkarini and Apte, “A
DOMAIN-SPECIFIC
AUTOMATIC TEXT
SUMMARIZATION USING
FUZZY LOGIC,”
INTERNATIONAL JOURNAL OF
COMPUTER ENGINEERING &
TECHNOLOGY, vol. 4, no. 4, pp.
–13, 2013, [Online]. Available:
www.iaeme.com/ijcet.asp
A. Y. Setiawan, I. Gede, M.
Darmawiguna, and G. A.
Pradnyana, “SENTIMENT
SUMMARIZATION EVALUASI
PEMBELAJARAN
MENGGUNAKAN
ALGORITMA LSTM (LONG
SHORT TERM MEMORY),”
Kumpulan Artikel Mahasiswa
Pendidikan Teknik Informatika
(KARMAPATI), vol. 11, no. 2,
F. V. P. Samosir, H. Toba, and M.
Ayub, “BESKlus : BERT
Extractive Summarization with K-
Means Clustering in Scientific
Paper,” Jurnal Teknik Informatika
dan Sistem Informasi, vol. 8, no. 1,
Apr. 2022, doi:
28932/jutisi.v8i1.4474.
M. Barbella, M. Risi, and G.
Tortora, “A comparison of
methods for the evaluation of text
summarization techniques,” in
Proceedings of the 10th
International Conference on Data
Science, Technology and
Applications, DATA 2021,
SciTePress, 2021, pp. 200–207.
doi: 10.5220/0010523002000207.
A. Firdaus, N. Yusliani, and D.
Rodiah, “Text Summarization
using K-Means Algorithm,” 2021.
[Online]. Available:
http://sjia.ejournal.unsri.ac.id
A. Farhath, “ABSTRACTIVE
TEXT SUMMARIZATION,”
International Research Journal of
Modernization in Engineering Technology and Science
www.irjmets.com @International
Research Journal of
Modernization in Engineering, pp.
–5208, 1967, doi:
56726/IRJMETS38320.
K. Kurniawan and S. Louvan,
“IndoSum: A New Benchmark
Dataset for Indonesian Text
Summarization,” in Proceedings
of the 2018 International
Conference on Asian Language
Processing, IALP 2018, Institute
of Electrical and Electronics
Engineers Inc., Jan. 2019, pp.
–220. doi:
1109/IALP.2018.8629109.
F. Halim and K. G. Liliana,
“Ringkasan Ekstraktif Otomatis
pada Berita Berbahasa Indonesia
Menggunakan Metode BERT.”
H. Dwiharyono and S. Suyanto,
“Stemming for Better Indonesian
Text-to-Phoneme,” Ampersand,
vol. 9, 2022, doi:
1016/j.amper.2022.100083.
A. N. Laili, P. P. Adikara, and S.
Adinugroho, “Rekomendasi Film
Berdasarkan Sinopsis
Menggunakan Metode
Word2Vec,” vol. 3, no. 6, pp.
–6043, 2019.
Q. Le and T. Mikolov,
“Distributed representations of
sentences and documents,” 31st
International Conference on
Machine Learning, ICML 2014,
vol. 4, pp. 2931–2939, 2014.
A. G. Etemad, A. I. Abidi, and M.
Chhabra, “Fine-Tuned T5 for
Abstractive Summarization,”
International Journal of
Performability Engineering, vol.
, no. 10, pp. 900–906, Oct.
, doi:
23940/ijpe.21.10.p8.900906.
A. Gupta, D. Chugh, and R.
Katarya, “Automated News
Summarization Using
Transformers.”
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2023 Jurnal Teknologi Informasi dan Komputer

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.