IMPLEMENTASI PERINGKAS DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN METODE TEXT TO TEXT TRANSFER TRANSFORMER (T5)

Authors

  • I Nyoman Purnama
  • Ni Nengah Widya Utami

DOI:

https://doi.org/10.36002/jutik.v9i4.2531

Keywords:

Peringkas, dokumen, T5, Bahasa Indonesia, ROUGE

Abstract

Dengan banyaknya informasi yang terdapat pada sebuah berita digital, membuat pembaca terkadang
mengalami kesulitan untuk mengetahui intisari dari kumpulan teks ini. Untuk itu dibutuhkan sebuah
sistem yang bisa meringkas berita digital berbahasa Indonesia secara otomatis. Peringkasan dokumen
adalah proses mengambil teks dari sebuah dokumen, menggali dan menyajikan informasi penting bagi
user atau aplikasi dalam bentuk rangkuman yang singkat dan padat. Ketika kita dihadapkan pada struktur
bahasa yang cukup kompleks, seperti pada Bahasa manusia, kemudian menangkap ide dan makna utama
teks asli. Disinilah digunakan model Transformer yang merupakan model peringkas yang berkinerja
tinggi. T5 merupakan contoh model transformer abstraktif yang menulis ulang kembali kalimatnya
daripada hanya mengambil kalimat langsung dari teks aslinya. Pada penelitian ini dilakukan proses
peringkasan dokumen berita berbahasa Indonesia dengan metode transformer T5. Penelitian ini
dikerjakan dengan tiga skenario. Bagian yang membedakan masing-masing skenario adalah pada bagian
preprocessing katanya. Pada skenario 1 diimplementasikan stemming dan stopwords removal, pada
skenario 2 diimplementasikan stemming tanpa stopwords removal, dan pada skenario 3 tidak
diimplementasikan keduanya. Adapun kesimpulan yang dapat diambil pada penelitian ini adalah
pengujian terbaik yang didapatkan adalah pengujian dengan skenario 2, yaitu dengan
mengimplementasikan stemming tanpa stopwords removal dengan nilai evaluasi ROUGE-1 0.17568.

References

P. Studi, T. Informatika, J. I.

Komputer, F. Matematika, D.

Ilmu, and P. Alam,

“PERINGKASAN TEKS

OTOMATIS UNTUK

DOKUMEN BAHASA BALI

BERBASIS METODE

EKTRAKTIF I Putu Gede Hendra

Suputra,” 2017.

W. Budiyono and F. Solihin,

“APLIKASI PERINGKAS

BERITA ONLINE OTOMATIS

MENGGUNAKAN METODE

ORDINARY WEIGHTING

PADA SITUS PENGUMPUL

BERITA,” 2014.

M. A. Zamzam, “SISTEM

AUTOMATIC TEXT

SUMMARIZATION

MENGGUNAKAN

ALGORITMA TEXTRANK,”

MATICS, vol. 12, no. 2, pp. 111–

, Sep. 2020, doi:

18860/mat.v12i2.8372.

R. Adelia, S. Suyanto, and U. N.

Wisesty, “Indonesian abstractive

text summarization using

bidirectional gated recurrent unit,”

in Procedia Computer Science,

Elsevier B.V., 2019, pp. 581–588.

doi: 10.1016/j.procs.2019.09.017.

Kulkarini and Apte, “A

DOMAIN-SPECIFIC

AUTOMATIC TEXT

SUMMARIZATION USING

FUZZY LOGIC,”

INTERNATIONAL JOURNAL OF

COMPUTER ENGINEERING &

TECHNOLOGY, vol. 4, no. 4, pp.

–13, 2013, [Online]. Available:

www.iaeme.com/ijcet.asp

A. Y. Setiawan, I. Gede, M.

Darmawiguna, and G. A.

Pradnyana, “SENTIMENT

SUMMARIZATION EVALUASI

PEMBELAJARAN

MENGGUNAKAN

ALGORITMA LSTM (LONG

SHORT TERM MEMORY),”

Kumpulan Artikel Mahasiswa

Pendidikan Teknik Informatika

(KARMAPATI), vol. 11, no. 2,

F. V. P. Samosir, H. Toba, and M.

Ayub, “BESKlus : BERT

Extractive Summarization with K-

Means Clustering in Scientific

Paper,” Jurnal Teknik Informatika

dan Sistem Informasi, vol. 8, no. 1,

Apr. 2022, doi:

28932/jutisi.v8i1.4474.

M. Barbella, M. Risi, and G.

Tortora, “A comparison of

methods for the evaluation of text

summarization techniques,” in

Proceedings of the 10th

International Conference on Data

Science, Technology and

Applications, DATA 2021,

SciTePress, 2021, pp. 200–207.

doi: 10.5220/0010523002000207.

A. Firdaus, N. Yusliani, and D.

Rodiah, “Text Summarization

using K-Means Algorithm,” 2021.

[Online]. Available:

http://sjia.ejournal.unsri.ac.id

A. Farhath, “ABSTRACTIVE

TEXT SUMMARIZATION,”

International Research Journal of

Modernization in Engineering Technology and Science

www.irjmets.com @International

Research Journal of

Modernization in Engineering, pp.

–5208, 1967, doi:

56726/IRJMETS38320.

K. Kurniawan and S. Louvan,

“IndoSum: A New Benchmark

Dataset for Indonesian Text

Summarization,” in Proceedings

of the 2018 International

Conference on Asian Language

Processing, IALP 2018, Institute

of Electrical and Electronics

Engineers Inc., Jan. 2019, pp.

–220. doi:

1109/IALP.2018.8629109.

F. Halim and K. G. Liliana,

“Ringkasan Ekstraktif Otomatis

pada Berita Berbahasa Indonesia

Menggunakan Metode BERT.”

H. Dwiharyono and S. Suyanto,

“Stemming for Better Indonesian

Text-to-Phoneme,” Ampersand,

vol. 9, 2022, doi:

1016/j.amper.2022.100083.

A. N. Laili, P. P. Adikara, and S.

Adinugroho, “Rekomendasi Film

Berdasarkan Sinopsis

Menggunakan Metode

Word2Vec,” vol. 3, no. 6, pp.

–6043, 2019.

Q. Le and T. Mikolov,

“Distributed representations of

sentences and documents,” 31st

International Conference on

Machine Learning, ICML 2014,

vol. 4, pp. 2931–2939, 2014.

A. G. Etemad, A. I. Abidi, and M.

Chhabra, “Fine-Tuned T5 for

Abstractive Summarization,”

International Journal of

Performability Engineering, vol.

, no. 10, pp. 900–906, Oct.

, doi:

23940/ijpe.21.10.p8.900906.

A. Gupta, D. Chugh, and R.

Katarya, “Automated News

Summarization Using

Transformers.”

Downloads

Published

2023-08-11

How to Cite

I Nyoman Purnama, & Ni Nengah Widya Utami. (2023). IMPLEMENTASI PERINGKAS DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN METODE TEXT TO TEXT TRANSFER TRANSFORMER (T5). Jurnal Teknologi Informasi Dan Komputer, 9(4). https://doi.org/10.36002/jutik.v9i4.2531

Similar Articles

1 2 3 4 5 6 7 8 9 10 > >> 

You may also start an advanced similarity search for this article.