ANALISIS SENTIMEN KOMENTAR BERPOTENSI TOXIC PADA MEDIA SOSIAL TIKTOK MENGGUNAKAN METODE DECISION TREE

SENTIMENT ANALYSIS OF POTENTIALLY TOXIC COMMENTS ON TIKTOK SOCIAL MEDIA USING THE DECISION TREE METHOD

Authors

  • Bobbin Ariyadi Jasno Universitas Bina Sarana Informatika
  • Ahmad Ariful Fathoni Universitas Bina Sarana Informatika
  • David Universitas Bina Sarana Informatika
  • Dwiki Dharma Putra Universitas Bina Sarana Informatika
  • Mohammad Zidane Hasan Universitas Bina Sarana Informatika
  • Fachry Amsury Universitas Bina Sarana Informatika
  • Hendra Supendar Universitas Bina Sarana Informatika

DOI:

https://doi.org/10.52972/hoaq.vol16no2.p193-201

Keywords:

Decision Tree, Analisis Sentimen, Komentar Toxic, TikTok, TF-IDF

Abstract

Penelitian ini bertujuan untuk mengatasi tantangan dalam mendeteksi dan mengklasifikasikan komentar berpotensi toxic secara otomatis pada media sosial TikTok, yang dikenal padat dengan bahasa informal, slang, dan cyber-aggression, menggunakan Analisis Sentimen dengan algoritma Decision Tree. Dataset yang digunakan terdiri dari 271 komentar primer yang dikumpulkan langsung dari feed video TikTok dan diklasifikasikan secara seimbang ke dalam kategori Toxic (Label = 1) dan Non-Toxic (Label = 0). Tahapan metodologi mencakup normalisasi bahasa slang TikTok, preprocessing teks, dan pembobotan fitur menggunakan Term Frequency–Inverse Document Frequency (TF-IDF) untuk menonjolkan fitur linguistik yang berkaitan dengan toksisitas. Hasil pengujian menunjukkan bahwa model menghasilkan akurasi sebesar 0,75, precision untuk kelas toxic sebesar 0,787, dan recall sebesar 0,765, sehingga mencerminkan performa aktual model dalam mendeteksi komentar toxic setelah proses preprocessing dan TF-IDF. Teknik post-pruning turut membantu mengurangi overfitting dan meningkatkan kemampuan generalisasi model terhadap data baru, meskipun penelitian ini tidak melakukan pengujian formal terhadap efisiensi komputasi maupun keandalan sistem. Secara keseluruhan, kombinasi normalisasi slang, TF-IDF, dan Decision Tree dengan post-pruning mampu menghasilkan performa klasifikasi yang stabil dalam identifikasi komentar toxic pada TikTok berbasis data primer.

 

This study aims to address the challenges of automatically detecting and classifying potentially toxic comments on the TikTok social media platform, which is characterized by heavy use of informal language, slang, and cyber-aggression, by applying Sentiment Analysis using the Decision Tree algorithm. The dataset consists of 271 primary comments collected directly from TikTok video feeds and evenly categorized into Toxic (Label = 1) and Non-Toxic (Label = 0). The methodological stages include TikTok-specific slang normalization, text preprocessing, and feature weighting using Term Frequency–Inverse Document Frequency (TF-IDF) to highlight linguistic features associated with toxicity. Experimental results show that the model achieves an accuracy of 0.75, a precision of 0.787, and a recall of 0.765 for the toxic class, reflecting the model’s actual performance after preprocessing and TF-IDF optimization. The application of post-pruning also helps reduce overfitting and improves the model’s generalization ability toward new data, although the study does not conduct formal evaluations of computational efficiency or system reliability. Overall, the combination of slang normalization, TF-IDF, and a pruned Decision Tree demonstrates stable classification performance in identifying toxic comments on TikTok based on the primary data used.

References

Rizki Misbah Hidayat, Abdul Rifki, and Ichsan Fauzi Rachman, “Dampak Paparan Konten Negatif di TikTok dan Instagram terhadap Kesehatan Mental Siswa: Kajian Literatur,” RISOMA : Jurnal Riset Sosial Humaniora dan Pendidikan., vol. 3, no. 3, pp. 136–143, 2025. doi: 10.62383/risoma.v3i3.769.

R. G. Nugraha, K. Rahmani, H. Kiswantomo, D. N. Aliifah, and A. Rahma, “Hubungan antara Self-Control dan Toxic Disinhibition Online Effect pada Mahasiswa yang Menggunakan Sosial Media Berdasarkan Survei yang dilakukan Asosiasi Penyelenggara Jasa Internet Indonesia,” Humanitas Jurnal Psikologi, vol. 7, no. 2, pp. 259–272, 2023. doi: 10.28932/humanitas.v7i2.5661.

A. Fatkhudin, F. A. Artanto, N. A. Safli, and D. Wibowo, “Decision Tree Berbasis SMOTE Dalam Analisis Sentimen Penggunaan Artificial Intelligence Untuk Skripsi,” REMIK: Riset dan E-Jurnal Manajemen Informatika, vol. 8, no. April, pp. 494–505, 2024. doi: 10.33395/remik.v8i2.13531.

H. Azalia, Nailah and Voutama. Apriade, “Penerapan Social Media Analytics Dalam Decision Support System di TikTok Shop,” Journal of Information Systems And Informatics Engineering, vol. 9, no. 1, pp. 167–176, 2025. doi: 10.35145/joisie.v9i1.4912.

A. Gerliandeva, Y. Chrisnanto, and H. Ashaury, “Optimasi Klasifikasi Sentimen pada Komentar Online menggunakan Multinomial Naïve Bayes dan Ekstraksi Fitur TF-IDF serta N-grams,” Jurnal Sistem Informasi, vol. 9, no. 2, pp. 260–272, 2024. doi: 10.30656/jsii.v11i2.9161.

Larasati, and W. S. J. Saputra., “Implementasi Deteksi Kekerasan Dengan Peringatan Visual Menggunakan,” Jurnal Riset Teknik Komputer., vol. 2, no. 2, pp. 7–17, 2025. doi: 10.69714/38wan661.

M. H. A. Sam, “Sentiment Analysis of Data Security in Indonesia Using Naive Bayes,” JATISI (Jurnal Teknik Informatika dan Sistem Informasi), vol. 12, no. 3, pp. 244-254, 2025. doi: 10.35957/jatisi.v12i3.12899.

D. Ciang, “Klasifikasi Toksisitas Komentar Dengan Algoritma Naive Bayes dan Decision Tree,” Jurnal Komputer dan Informatika., vol. 18, no. 1, pp. 31–37, 2023. doi: 10.24912/jki.v18i1.34444.

N. H. Inda Arifin and W. J. Shudiq, “Algoritma Decision Tree Dengan Menggunakan Pruning dan Missing Value Untuk Prediksi Kredit Macet,” COREAI (Jurnal Kecerdasan Buatan, Komputasi dan Teknologi Informasi)., vol. 3, no. 1, pp. 38–45, 2022. doi: 10.33650/coreai.v3i1.4124.

C. N. Syahputri and M. S. Hasibuan, “Optimasi Klasifikasi Decision Tree Dengan Teknik Pruning Untuk Mengurangi Overfitting,” JSiI (Jurnal Sist. Informasi), vol. 11, no. 2, pp. 87–96, 2024. doi: 10.30656/jsii.v11i2.9161.

S. Azhari, N. Rahaningsih, R. D. Dana, K. Cirebon, A. Sentimen, and G. Play, “Peningkatan Akurasi Analisis Sentimen Pada Aplikasi Loklok Dengan Metode Naïve Bayes,” Jurnal Informatika Dan Teknik Elektro Terapan., vol. 13, no. 1, 2025. doi: 10.23960/jitet.v12i3.5848.

L. Rhomaningtias, A. Khairunisa, S. Shella, M. Wara, and K. M. Hindrayani, “Analisis Sentimen Ulasan Aplikasi Smile Indonesia Menggunakan Metode Naive Bayes dan Support Vector Machine (SVM),” Jurnal Teknolologi Informasi., vol. 16, no. 1, pp. 79–91, 2025. doi: 10.52972/hoaq.vol16no1.

P. M. S. Ardinata, A. A. J. Permana, and I. N. S. W. Wijaya, “Identifikasi dan Normalisasi Teks Slang Dengan,” Jurnal Pendidikan Teknologi dan Kejuruan., vol. 21, no. 1, 2024. doi: 10.23887/jptkundiksha.v21i1.66381.

L. A. Fitriana, “Analisis Ulasan Konsumen sebagai Data Non-Keuangan dalam Sistem Informasi Akuntansi,” Jurnal Profitabilitas., vol. 5, no. 1, pp. 64–74, 2025. doi: 10.31294/profitabilitas.v5i1.8269.

A. Nurian and T. N. Padilah, “Disdukcapil Karawang Menggunakan Naive,” Jurnal Informatika Dan Teknik Elektro Terapan., vol. 12, no. 2, 2024. doi: 10.23960/jitet.v12i2.4178.

A. Nafi, A. Tri, J. Harjanta, B. A. Herlambang, and S. Fahmi, “Analisis Sentimen Review Pelanggan Lazada dengan Sastrawi Stemmer dan SVM-PSO untuk Memahami Respon Pengguna,” Journal Information Technology., vol. 12, no. 204, pp. 330–339, 2024. doi: 10.32664/j-intech.v12i02.1450.

Downloads

Published

15-12-2025

How to Cite

Jasno, B. A., Fathoni, A. A., David, Putra, D. D., Hasan, M. Z., Amsury, F., & Supendar, H. (2025). ANALISIS SENTIMEN KOMENTAR BERPOTENSI TOXIC PADA MEDIA SOSIAL TIKTOK MENGGUNAKAN METODE DECISION TREE: SENTIMENT ANALYSIS OF POTENTIALLY TOXIC COMMENTS ON TIKTOK SOCIAL MEDIA USING THE DECISION TREE METHOD. HOAQ (High Education of Organization Archive Quality) : Jurnal Teknologi Informasi, 16(2), 193–201. https://doi.org/10.52972/hoaq.vol16no2.p193-201

Most read articles by the same author(s)