HYBRID TIME SERIES CLASSIFICATION UNTUK DETEKSI RISIKO KESEHATAN MENTAL BERBASIS INDOBERT DAN BI-LSTM

Authors

  • Yassa Ayu Rahmadhani Universitas Islam Sultan Agung
  • Mustafa Universitas Islam Sultan Agung

DOI:

https://doi.org/10.70248/jrsit.v3i4.3688

Keywords:

Analisis Sentimen, Bi-LSTM, IndoBERT, Kesehatan Mental, Time series

Abstract

Penelitian ini bertujuan untuk mengembangkan pendekatan Hybrid Time Series Classification berbasis IndoBERT dan Bidirectional Long Short-Term Memory (Bi-LSTM) dalam mendeteksi risiko kesehatan mental melalui analisis dinamika sentimen temporal pada data media sosial. Metode penelitian yang digunakan meliputi pengumpulan data Twitter (X), preprocessing teks, filtering konteks kesehatan mental menggunakan kombinasi keyword matching dan validasi kontekstual berbasis IndoBERT, penanganan data imbalance melalui teknik oversampling dan undersampling, transformasi data ke dalam bentuk deret waktu, feature engineering, serta pemodelan menggunakan Bi-LSTM. Evaluasi model dilakukan menggunakan confusion matrix, accuracy, precision, recall, dan F1-score, sedangkan hasil analisis divisualisasikan melalui dashboard interaktif berbasis Streamlit. Hasil penelitian menunjukkan bahwa proses filtering berhasil meningkatkan relevansi data dari 23.644 tweet menjadi 7.266 tweet yang sesuai dengan konteks kesehatan mental. Selain itu, penerapan teknik balancing terbukti meningkatkan performa model secara signifikan, ditunjukkan oleh peningkatan nilai accuracy dari 0,4789 menjadi 1,0000 dan F1-score dari 0,5240 menjadi 1,0000. Model juga mampu menangkap pola sentimen temporal serta mengklasifikasikan tingkat risiko kesehatan mental ke dalam kategori rendah, sedang, dan tinggi dengan tingkat akurasi yang sangat tinggi. Simpulan penelitian ini menunjukkan bahwa pendekatan hybrid berbasis IndoBERT dan Bi-LSTM efektif dalam mengintegrasikan pemahaman konteks bahasa dan dinamika temporal untuk mendeteksi risiko kesehatan mental secara adaptif, sehingga berpotensi mendukung pengembangan sistem pemantauan kesehatan mental berbasis media sosial yang lebih representatif dan informatif.

 

References

D. Valdez, M. ten Thij, K. Bathina, L. A. Rutter, and J. Bollen, “Social media insights into US mental health during the COVID-19 pandemic: Longitudinal analysis of twitter data,” J. Med. Internet Res., vol. 22, no. 12, 2020, doi: 10.2196/21418.

B. Lim, S. Zohren, and B. Lim, “Time-series forecasting with deep learning : a survey Subject Areas : Author for correspondence :,” no. April, 2026, doi: 10.1098/rsta.2020.0209/248905/rsta.2020.0209.pdf.

J. Cui, Z. Wang, S. Ho, and E. Cambria, Survey on sentiment analysis : evolution of research methods and topics, vol. 56, no. 8. Springer Netherlands, 2023. doi: 10.1007/s10462-022-10386-z.

M. C. C. Utomo, M. Taukhid, and S. Mujahidin, “Analisis Sentimen Media Sosial Twitter pada Kasus Pemberlakuan Pembatasan Kegiatan Masyarakat dengan menggunakan Metode Naïve Bayes Classifier,” EQUIVA J. J. Math. Inf. Technol., vol. 1, pp. 41–48, 2023, doi: 10.35718/equiva.v1i1.815.

H. Kaur, S. U. Ahsaan, B. Alankar, and V. Chang, “A Proposed Sentiment Analysis Deep Learning Algorithm for Analyzing COVID-19 Tweets,” pp. 1417–1429, 2021, doi: 10.1007/s10796-021-10135-7.

F. Koto and T. Baldwin, “IndoLEM and IndoBERT : A Benchmark Dataset and Pre-trained Language Model for Indonesian NLP,” pp. 757–770, 2020, doi: 10.18653/v1/2020.coling-main.66.

M. C. Kenton, L. Kristina, and J. Devlin, “BERT : Pre-training of Deep Bidirectional Transformers for Language Understanding,” pp. 4171–4186, 2019, doi: 10.48550/arXiv.1810.04805.

P. Haryoko, A. Syukur, and N. Rijiati, “Development of a Mental Health Classifier Using LSTM and Text Preprocessing Techniques,” vol. 12, no. 1, pp. 77–86, 2025, doi: 10.15294/sji.v12i1.21216.

A. Kolliakou et al., “Mental health-related conversations on social media and crisis episodes : a time-series regression analysis,” pp. 1–7, 2020, doi: 10.1038/s41598-020-57835-9.

A. P. Ratnasari and R. Nur, “Performance of Random Oversampling , Random Undersampling , and SMOTE-NC Methods in Handling Imbalanced Class in Classification Models,” vol. 12, no. 04, pp. 494–501, 2024, doi: 10.18535/ijsrm/v12i04.m03.

M. Altalhan, A. Algarni, and M. T. Alouane, “Imbalanced Data Problem in Machine Learning : A Review,” IEEE Access, vol. 13, no. December 2024, pp. 13686–13699, 2025, doi: 10.1109/ACCESS.2025.3531662.

C. Li, K. Liu, and S. Liu, “A Survey of Loss Functions in Deep Learning,” vol. 1, no. 1, pp. 1–50, 2025, doi: 10.3390/math13152417.

A. Tharwat, “Classification assessment methods,” vol. 17, no. 1, pp. 168–192, 2026, doi: 10.1016/j.aci.2018.08.003.

D. Chicco and G. Jurman, “The advantages of the Matthews correlation coefficient ( MCC ) over F1 score and accuracy in binary classification evaluation,” pp. 1–13, 2020, doi: 10.1186/s12864-019-6413-7.

A. Kolliakou et al., “Mental health-related conversations on social media and crisis episodes: a time-series regression analysis,” Sci. Rep., vol. 10, no. 1, pp. 1–7, 2020, doi: 10.1038/s41598-020-57835-9.

A. Agung, G. Wahyu, S. Erlangga, I. G. A. Gunadi, and I. M. G. Sunarya, “Kombinasi Oversampling dan Undersampling dalam Menangani Class Imbalanced dan Overlapping pada Klasifikasi Data Bank Marketing,” vol. 3, no. 1, pp. 32–42, 2024, doi: 10.31598/jurnalresistor.v7i1.1515.

A. A. Jamali, C. Berger, and R. J. Spiteri, “Momentary Depressive Feeling Detection Using X ( Formerly Twitter ) Data : Contextual Language Approach Corresponding Author :,” vol. 2, pp. 1–12, 2023, doi: 10.2196/49531.

V. Cerqueira, L. Torgo, and I. Mozetič, Evaluating time series forecasting models : an empirical study on performance estimation methods, vol. 109, no. 11. Springer US, 2020. doi: 10.1007/s10994-020-05910-7.

Y. Ensafi, S. Hassanzadeh, G. Zhang, and B. Shah, “International Journal of Information Management Data Insights Time-series forecasting of seasonal items sales using machine learning – A comparative analysis,” Int. J. Inf. Manag. Data Insights, vol. 2, no. 1, p. 100058, 2022, doi: 10.1016/j.jjimei.2022.100058.

A. Bashar, R. Nayak, and T. Balasubramaniam, “Deep learning based topic and sentiment analysis : COVID19 information seeking on social media,” Soc. Netw. Anal. Min., vol. 12, no. 1, pp. 1–15, 2022, doi: 10.1007/s13278-022-00917-5.

Downloads

Published

2026-05-31

How to Cite

Yassa Ayu Rahmadhani, & Mustafa. (2026). HYBRID TIME SERIES CLASSIFICATION UNTUK DETEKSI RISIKO KESEHATAN MENTAL BERBASIS INDOBERT DAN BI-LSTM. Jurnal Rekayasa Sistem Informasi Dan Teknologi, 3(4), 622–635. https://doi.org/10.70248/jrsit.v3i4.3688

Issue

Section

Artikel