EKSTRAKSI INFORMASI DAN KLASIFIKASI BERITA PEMERINTAHAN DAERAH MENGGUNAKAN FINE-TUNING INDOBERT

Authors

  • Arfiana Maulidiyah Universitas Islam Sultan Agung Semarang
  • Mustafa Universitas Islam Sultan Agung Semarang

DOI:

https://doi.org/10.70248/jdaics.v3i2.3714

Abstract

Pemanfaatan kebijakan berbasis penelitian (Evidence-Based Policy) semakin penting dalam mendukung pengambilan keputusan pemerintah daerah, khususnya pada sektor pendidikan, kesehatan, dan ketenagakerjaan di Provinsi Jawa Tengah. Tingginya volume berita berani yang dipublikasikan setiap hari menjadi tantangan bagi Organisasi Perangkat Daerah (OPD) dalam mengumpulkan dan menganalisis informasi secara manual. Penelitian ini bertujuan mengembangkan sistem ekstraksi informasi dan klasifikasi berita pemerintahan daerah secara otomatis menggunakan fine-tuning IndoBERT. Dataset terdiri dari 1.025 artikel berita yang dikumpulkan melalui web scraping dari empat media dare, kemudian diseleksi menjadi 377 data berlabel setelah melalui preprocessing, ekstraksi entitas Named Entity Recognition (NER), dan pelabelan semi-otomatis. Model IndoBERT disempurnakan untuk mengklasifikasikan berita ke dalam tiga kategori OPD: Dinas Pendidikan, Dinas Kesehatan, dan Dinas Ketenagakerjaan. Hasil evaluasi menunjukkan akurasi sebesar 88,16%, dengan presisi makro 0,88, recall makro 0,87, dan F1-score makro 0,87 pada pengujian data. Sistem ini diimplementasikan dalam dashboard Streamlit interaktif yang membantu OPD mengidentifikasi strategi isu secara cepat dan akurat, mendukung tata kelola pemerintahan berbasis data.

References

D. A. N. Berkesinambungan, “Rencana pembangunan jangka menengah nasional 2020-2024,” 2024.

A. Davina, M. Putri, N. Sulistianingsih, and R. Rismayati, “JTIM : Jurnal Teknologi Informasi dan Multimedia Pengaruh Teknik Representasi Teks Bag-of-Words dan TF-IDF,” vol. 7, no. 4, pp. 675–688, 2025.

N. Hafidhigbal, IMPLEMENTASI MODEL INDOBERT UNTUK KLASIFIKASI JENIS TINDAK PIDANA KORUPSI KLASIFIKASI JENIS TINDAK PIDANA KORUPSI. 2024.

M. Deagama, S. Antariksa, A. Sugiharto, and B. Surarso, “Jurnal resti,” vol. 9, no. 4, pp. 754–764, 2025.

S. Sagita, “Peran Indeks Transformasi Digital Nasional sebagai Instrumen Evidence Based Policy di Indonesia Pendahuluan,” vol. 5, no. 2, pp. 47–59, 2025.

C. J. L. Tobing, I. G. N. L. Wijayakusuma, L. Putu, I. Harini, and U. Udayana, “Deteksi Berita Hoax Politik Menggunakan Fine-Tuning IndoBERT,” vol. 9, no. 2, pp. 354–360, 2025.

I. A. Oktariansyah, F. R. Umbara, and F. Kasyidi, “Klasifikasi Sentimen Untuk Mengetahui Kecenderungan Politik Pengguna X Pada Calon Presiden Indonesia 2024 Menggunakan Metode IndoBert,” vol. 6, no. 2, pp. 636–648, 2024.

A. S. Rizky and E. Y. Hidayat, “Emotion Classification in Indonesian Text Using IndoBERT,” vol. x, no. x, 2022.

H. F. Karim and A. P. Wibowo, “Kinerja Metode Fine-Tuning IndoBERT untuk Klasifikasi Emosi Multi-Kelas pada Teks Informal Bahasa Indonesia,” vol. 6, no. 1, pp. 63–74, 2025, doi: 10.47065/bulletincsr.v6i1.850.

F. Koto and A. Rahimi, “Machine Translated by Google IndoLEM dan IndoBERT : Dataset Benchmark dan Dataset Pra-Pelatihan Model Bahasa untuk NLP Indonesia 1Universitas Melbourne 2Universitas Queensland Timothy Baldwin1 Machine Translated by Google,” pp. 8–13, 2020.

B. Juarto, “INTELLIGENT SYSTEMS AND APPLICATIONS IN ENGINEERING Indonesian News Classification Using IndoBert,” pp. 0–2, 2023.

A. Simanjuntak et al., “Studi dan Analisis Hyperparameter Tuning IndoBERT Dalam Pendeteksian Berita Palsu,” J. Nas. Tek. Elektro dan Teknol. Inf., vol. 13, no. 1, pp. 60–67, 2024.

A. Kunaefi, Z. Abidin, and R. Kusumawati, “Klasifikasi berita hoaks bahasa indonesia menggunakan indobert,” JIPI (Jurnal Ilm. Penelit. dan Pembelajaran Inform., vol. 10, no. 2, pp. 1706–1714, 2025.

C. J. L. Tobing, I. G. N. L. Wijayakusuma, L. Putu, I. Harini, and U. Udayana, “Detection of Political Hoax News Using Fine-Tuning IndoBERT,” vol. 9, no. 2, pp. 354–360, 2025.

T. Iskandar, Z. Maulana, and A. F. Bukhori, “Model Klasifikasi Berbasis Multiclass Classification dengan Kombinasi Indobert Embedding dan Long Short- Term Memory untuk Tweet Berbahasa Indonesia ( Classification Model Based on Multiclass Classification with a Combination of Indobert Embedding and Long Short-Term Memory for Indonesian-language Tweets ),” vol. 1, no. 1, pp. 1–28, 2022.

I. Budi and R. R. Suryono, “Application of named entity recognition method for Indonesian datasets : a review,” vol. 12, no. 2, pp. 969–978, 2023, doi: 10.11591/eei.v12i2.4529.

R. Merdiansah and A. A. Ridha, “Analisis Sentimen Pengguna X Indonesia Terkait Kendaraan Listrik Menggunakan IndoBERT,” vol. 7, pp. 221–228, 2024.

D. Nuryadi et al., “FINE TUNING INDOBERT UNTUK ANALISIS SENTIMEN PADA ULASAN PENGGUNA APLIKASI TIKET . COM DI GOOGLE PLAY STORE,” vol. 9, no. 2, pp. 3577–3583, 2025.

D. Ramdani, M. Irfan, and N. Lukman, “Perbandingan Kinerja IndoBERT , IndoRoBERTa dan NusaBERT dalam Analisis Sentimen Isu LGBT di Media Sosial X,” vol. 8, no. 2, pp. 91–107, 2025.

J. Federico, I. D. Made, and B. Atmaja, “Klasifikasi Berita Berdasarkan Kategori Menggunakan Convolutional Neural Network dengan IndoBERT,” vol. 3, pp. 899–906, 2025.

Downloads

Published

2026-04-30

How to Cite

Maulidiyah, A., & Mustafa. (2026). EKSTRAKSI INFORMASI DAN KLASIFIKASI BERITA PEMERINTAHAN DAERAH MENGGUNAKAN FINE-TUNING INDOBERT. Journal of Data Analytics, Information, and Computer Science, 3(2), 91–108. https://doi.org/10.70248/jdaics.v3i2.3714

Issue

Section

Articles