IMPLEMENTASI STABLE DIFFUSION DAN FINE-TUNING LOW RANK ADAPTATION UNTUK PEMBUATAN LOGO

Authors

  • Naela Mukaromah Universitas Islam Sultan Agung
  • Sri Mulyono Universitas Islam Sultan Agung

DOI:

https://doi.org/10.70248/jrsit.v2i3.1885

Abstract

Penelitian ini bertujuan untuk mengembangkan sistem yang mampu menghasilkan logo berdasarkan deskripsi teks menggunakan model Stable Diffusion versi 1.5 dan teknik Fine-Tuning Low Rank Adaptation (LoRA). Studi literatur dilakukan untuk memahami pendekatan terbaik dalam implementasi text-to-image, model stable diffusion, dan metode evaluasi gambar. Dataset yang digunakan terdiri dari 50 gambar logo yang dikumpulkan dari berbagai sumber dan dilengkapi dengan image captioning. Dataset ini kemudian diproses melalui tahap preprocessing yang mencakup resize, standarisasi format, cropping, serta rotation dan flipping untuk meningkatkan variasi data. Pengembangan model melibatkan pelatihan Stable Diffusion 1.5 dengan fine-tuning LoRA, yang memungkinkan model beradaptasi dengan tugas spesifik tanpa memerlukan sumber daya komputasi yang besar. Proses pelatihan dilakukan dengan 400 iterasi untuk menghindari overfitting pada dataset yang terbatas. Pengujian sistem dilakukan dengan menghasilkan gambar berdasarkan teks deskripsi yang sama dengan caption data uji, kemudian dievaluasi menggunakan metrik CLIP-MMD dan Frechet Inception Distance (FID). Hasil penelitian menunjukkan bahwa model yang telah dilatih dapat menghasilkan gambar logo yang sesuai dengan deskripsi teks, dengan nilai CLIP-MMD dan FID yang menunjukkan kesesuaian gambar dengan dataset uji. Penelitian ini berkontribusi dalam pengembangan teknologi AI generatif untuk kebutuhan desain logo bagi pelaku UMKM, sehingga memungkinkan pembuatan logo secara efisien tanpa memerlukan keahlian desain grafis. Dengan penerapan teknik LoRA, penelitian ini juga membuktikan efektivitas fine-tuning dalam meningkatkan performa model generatif dengan sumber daya yang lebih rendah.

Kata Kunci: Text-to-Image, Stable Diffusion, LoRA Fine-Tuning, AI Generatif, Evaluasi Gambar

References

Aftitah, F. N., K, J. L., Hasanah, K., Lailatul, N., Bina, U., & Informatika, S. (2025). Pengaruh UMKM Terhadap Pertumbuhan Ekonomi Di Indonesia Pada Tahun 2023 Pemerintah mendukung UMKM melalui program seperti Kredit Usaha Rakyat ( KUR ), meskipun penyalurannya tahun 2023 belum memenuhi target . UMKM kini terus. 3, 32–43.

Arly, A., Dwi, N., & Andini, R. (2023). Implementasi Penggunaan Artificial Intelligence Dalam Proses Pembelajaran Mahasiswa Ilmu Komunikasi di Kelas A. Prosiding Seminar Nasional, 362–374.

Aulia, F., Afriwan, H., & Faisal, D. (2021). Konsistensi Logo Dalam Membangun Sistem Identitas. Gorga : Jurnal Seni Rupa, 10(2), 439. https://doi.org/10.24114/gr.v10i2.28131

Cuevas, E., Avalos, O., & Gálvez, J. (2023). Analysis and Comparison of Metaheuristics. 1063(November), 21–24.

Faiz Muntazori, A., & Listya, A. (2021). Branding UMKM Produk Kopi Bang Sahal melalui Desain Logo. SENADA : Semangat Nasional Dalam Mengabdi, 1(3), 342–351.

Halim, A. (2020). Pengaruh Pertumbuhan Usaha Mikro, Kecil dan Menengah Terhadap Pertumbuhan. Ekonomi, 2(September), 158.

Hu, E., Shen, Y., Wallis, P., Allen-Zhu, Z., Li, Y., Wang, S., Wang, L., & Chen, W. (2022). Lora: Low-Rank Adaptation of Large Language Models. ICLR 2022 - 10th International Conference on Learning Representations, 1–26.

Huang, P., Gao, X., Huang, L., Jiao, J., Li, X., Wang, Y., & Guo, Y. (2024). Chest-Diffusion: A Light-Weight Text-to-Image Model for Report-to-CXR Generation. Proceedings - International Symposium on Biomedical Imaging, 1–5. https://doi.org/10.1109/ISBI56570.2024.10635417

Jayasumana, S., Ramalingam, S., Veit, A., Glasner, D., Chakrabarti, A., & Kumar, S. (2023). Rethinking FID: Towards a Better Evaluation Metric for Image Generation. https://doi.org/10.1109/CVPR52733.2024.00889

Liu, B., Wang, C., Cao, T., Jia, K., & Huang, J. (2024). Towards Understanding Cross and Self-Attention in Stable Diffusion for Text-Guided Image Editing. https://doi.org/10.1109/CVPR52733.2024.00747

Liu, C., Takikawa, T., & Jacobson, A. (2024). A LoRA is Worth a Thousand Pictures.

Mahendra, A. (2022). Implementasi low-rank adaptation of large languange model (lora) untuk effisiensi large language model. 8(3), 110–118.

Naseem, B. (2024). Temporal Scene Generation with Stable Diffusion. Huggingface.Co.

Pradana, A. G., Setiadi, D. R. I. M., & Muslikh, A. R. (2024). Fine tuning model Convolutional Neural Network EfficientNet-B4 dengan augmentasi data untuk klasifikasi penyakit kakao. Journal of Information System and Application Development, 2(1), 01–11. https://doi.org/10.26905/jisad.v2i1.11899

Ramzan, S., Iqbal, M. M., & Kalsum, T. (2022). Text-to-Image Generation Using Deep Learning †. Engineering Proceedings, 20(1), 1–6. https://doi.org/10.3390/engproc2022020016

Sasongko, T. B., Haryoko, H., & Amrullah, A. (2023). Analisis Efek Augmentasi Dataset dan Fine Tune pada Algoritma Pre-Trained Convolutional Neural Network (CNN). Jurnal Teknologi Informasi Dan Ilmu Komputer, 10(4), 763–768. https://doi.org/10.25126/jtiik.20241046583

Sony Maulana, M., Nurmalasari, Rheno Widianto, S., Dewi Ayu Safitri, S., & Maulana, R. (2023). Pelatihan Chat Gpt Sebagai Alat Pembelajaran Berbasis Artificial Intelligence Di Kelas. Jurnal Penelitian Dan Pengabdian Masyarakat Jotika, 3(1), 16–19. https://doi.org/10.56445/jppmj.v3i1.103

Sultan, Y., Ma, J., & Liao, Y.-Y. (2024). Fine-Tuning Stable Diffusion XL for Stylistic Icon Generation: A Comparison of Caption Size.

Xiao, S., Wang, L., Ma, X., & Zeng, W. (2024). TypeDance: Creating Semantic Typographic Logos from Image through Personalized Generation. Conference on Human Factors in Computing Systems - Proceedings, 1–24. https://doi.org/10.1145/3613904.3642185

Yu, Y., Zhang, W., & Deng, Y. (2021). Frechet inception distance (fid) for evaluating gans. Researchgate.Net, September, 1–7.

Downloads

Published

2025-02-12

How to Cite

Mukaromah, N., & Mulyono, S. (2025). IMPLEMENTASI STABLE DIFFUSION DAN FINE-TUNING LOW RANK ADAPTATION UNTUK PEMBUATAN LOGO. Jurnal Rekayasa Sistem Informasi Dan Teknologi, 2(3), 973–984. https://doi.org/10.70248/jrsit.v2i3.1885

Issue

Section

Artikel