ANALISIS SENTIMEN KOMENTAR BERPOTENSI TOXIC PADA MEDIA SOSIAL TIKTOK MENGGUNAKAN METODE DECISION TREE
SENTIMENT ANALYSIS OF POTENTIALLY TOXIC COMMENTS ON TIKTOK SOCIAL MEDIA USING THE DECISION TREE METHOD
DOI:
https://doi.org/10.52972/hoaq.vol16no2.p193-201Keywords:
Decision Tree, Analisis Sentimen, Komentar Toxic, TikTok, TF-IDFAbstract
Penelitian ini bertujuan untuk mengatasi tantangan dalam mendeteksi dan mengklasifikasikan komentar berpotensi toxic secara otomatis pada media sosial TikTok, yang dikenal padat dengan bahasa informal, slang, dan cyber-aggression, menggunakan Analisis Sentimen dengan algoritma Decision Tree. Dataset yang digunakan terdiri dari 271 komentar primer yang dikumpulkan langsung dari feed video TikTok dan diklasifikasikan secara seimbang ke dalam kategori Toxic (Label = 1) dan Non-Toxic (Label = 0). Tahapan metodologi mencakup normalisasi bahasa slang TikTok, preprocessing teks, dan pembobotan fitur menggunakan Term Frequency–Inverse Document Frequency (TF-IDF) untuk menonjolkan fitur linguistik yang berkaitan dengan toksisitas. Hasil pengujian menunjukkan bahwa model menghasilkan akurasi sebesar 0,75, precision untuk kelas toxic sebesar 0,787, dan recall sebesar 0,765, sehingga mencerminkan performa aktual model dalam mendeteksi komentar toxic setelah proses preprocessing dan TF-IDF. Teknik post-pruning turut membantu mengurangi overfitting dan meningkatkan kemampuan generalisasi model terhadap data baru, meskipun penelitian ini tidak melakukan pengujian formal terhadap efisiensi komputasi maupun keandalan sistem. Secara keseluruhan, kombinasi normalisasi slang, TF-IDF, dan Decision Tree dengan post-pruning mampu menghasilkan performa klasifikasi yang stabil dalam identifikasi komentar toxic pada TikTok berbasis data primer.
This study aims to address the challenges of automatically detecting and classifying potentially toxic comments on the TikTok social media platform, which is characterized by heavy use of informal language, slang, and cyber-aggression, by applying Sentiment Analysis using the Decision Tree algorithm. The dataset consists of 271 primary comments collected directly from TikTok video feeds and evenly categorized into Toxic (Label = 1) and Non-Toxic (Label = 0). The methodological stages include TikTok-specific slang normalization, text preprocessing, and feature weighting using Term Frequency–Inverse Document Frequency (TF-IDF) to highlight linguistic features associated with toxicity. Experimental results show that the model achieves an accuracy of 0.75, a precision of 0.787, and a recall of 0.765 for the toxic class, reflecting the model’s actual performance after preprocessing and TF-IDF optimization. The application of post-pruning also helps reduce overfitting and improves the model’s generalization ability toward new data, although the study does not conduct formal evaluations of computational efficiency or system reliability. Overall, the combination of slang normalization, TF-IDF, and a pruned Decision Tree demonstrates stable classification performance in identifying toxic comments on TikTok based on the primary data used.
References
Rizki Misbah Hidayat, Abdul Rifki, and Ichsan Fauzi Rachman, “Dampak Paparan Konten Negatif di TikTok dan Instagram terhadap Kesehatan Mental Siswa: Kajian Literatur,” RISOMA : Jurnal Riset Sosial Humaniora dan Pendidikan., vol. 3, no. 3, pp. 136–143, 2025. doi: 10.62383/risoma.v3i3.769.
R. G. Nugraha, K. Rahmani, H. Kiswantomo, D. N. Aliifah, and A. Rahma, “Hubungan antara Self-Control dan Toxic Disinhibition Online Effect pada Mahasiswa yang Menggunakan Sosial Media Berdasarkan Survei yang dilakukan Asosiasi Penyelenggara Jasa Internet Indonesia,” Humanitas Jurnal Psikologi, vol. 7, no. 2, pp. 259–272, 2023. doi: 10.28932/humanitas.v7i2.5661.
A. Fatkhudin, F. A. Artanto, N. A. Safli, and D. Wibowo, “Decision Tree Berbasis SMOTE Dalam Analisis Sentimen Penggunaan Artificial Intelligence Untuk Skripsi,” REMIK: Riset dan E-Jurnal Manajemen Informatika, vol. 8, no. April, pp. 494–505, 2024. doi: 10.33395/remik.v8i2.13531.
H. Azalia, Nailah and Voutama. Apriade, “Penerapan Social Media Analytics Dalam Decision Support System di TikTok Shop,” Journal of Information Systems And Informatics Engineering, vol. 9, no. 1, pp. 167–176, 2025. doi: 10.35145/joisie.v9i1.4912.
A. Gerliandeva, Y. Chrisnanto, and H. Ashaury, “Optimasi Klasifikasi Sentimen pada Komentar Online menggunakan Multinomial Naïve Bayes dan Ekstraksi Fitur TF-IDF serta N-grams,” Jurnal Sistem Informasi, vol. 9, no. 2, pp. 260–272, 2024. doi: 10.30656/jsii.v11i2.9161.
Larasati, and W. S. J. Saputra., “Implementasi Deteksi Kekerasan Dengan Peringatan Visual Menggunakan,” Jurnal Riset Teknik Komputer., vol. 2, no. 2, pp. 7–17, 2025. doi: 10.69714/38wan661.
M. H. A. Sam, “Sentiment Analysis of Data Security in Indonesia Using Naive Bayes,” JATISI (Jurnal Teknik Informatika dan Sistem Informasi), vol. 12, no. 3, pp. 244-254, 2025. doi: 10.35957/jatisi.v12i3.12899.
D. Ciang, “Klasifikasi Toksisitas Komentar Dengan Algoritma Naive Bayes dan Decision Tree,” Jurnal Komputer dan Informatika., vol. 18, no. 1, pp. 31–37, 2023. doi: 10.24912/jki.v18i1.34444.
N. H. Inda Arifin and W. J. Shudiq, “Algoritma Decision Tree Dengan Menggunakan Pruning dan Missing Value Untuk Prediksi Kredit Macet,” COREAI (Jurnal Kecerdasan Buatan, Komputasi dan Teknologi Informasi)., vol. 3, no. 1, pp. 38–45, 2022. doi: 10.33650/coreai.v3i1.4124.
C. N. Syahputri and M. S. Hasibuan, “Optimasi Klasifikasi Decision Tree Dengan Teknik Pruning Untuk Mengurangi Overfitting,” JSiI (Jurnal Sist. Informasi), vol. 11, no. 2, pp. 87–96, 2024. doi: 10.30656/jsii.v11i2.9161.
S. Azhari, N. Rahaningsih, R. D. Dana, K. Cirebon, A. Sentimen, and G. Play, “Peningkatan Akurasi Analisis Sentimen Pada Aplikasi Loklok Dengan Metode Naïve Bayes,” Jurnal Informatika Dan Teknik Elektro Terapan., vol. 13, no. 1, 2025. doi: 10.23960/jitet.v12i3.5848.
L. Rhomaningtias, A. Khairunisa, S. Shella, M. Wara, and K. M. Hindrayani, “Analisis Sentimen Ulasan Aplikasi Smile Indonesia Menggunakan Metode Naive Bayes dan Support Vector Machine (SVM),” Jurnal Teknolologi Informasi., vol. 16, no. 1, pp. 79–91, 2025. doi: 10.52972/hoaq.vol16no1.
P. M. S. Ardinata, A. A. J. Permana, and I. N. S. W. Wijaya, “Identifikasi dan Normalisasi Teks Slang Dengan,” Jurnal Pendidikan Teknologi dan Kejuruan., vol. 21, no. 1, 2024. doi: 10.23887/jptkundiksha.v21i1.66381.
L. A. Fitriana, “Analisis Ulasan Konsumen sebagai Data Non-Keuangan dalam Sistem Informasi Akuntansi,” Jurnal Profitabilitas., vol. 5, no. 1, pp. 64–74, 2025. doi: 10.31294/profitabilitas.v5i1.8269.
A. Nurian and T. N. Padilah, “Disdukcapil Karawang Menggunakan Naive,” Jurnal Informatika Dan Teknik Elektro Terapan., vol. 12, no. 2, 2024. doi: 10.23960/jitet.v12i2.4178.
A. Nafi, A. Tri, J. Harjanta, B. A. Herlambang, and S. Fahmi, “Analisis Sentimen Review Pelanggan Lazada dengan Sastrawi Stemmer dan SVM-PSO untuk Memahami Respon Pengguna,” Journal Information Technology., vol. 12, no. 204, pp. 330–339, 2024. doi: 10.32664/j-intech.v12i02.1450.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 HOAQ (High Education of Organization Archive Quality) : Jurnal Teknologi Informasi

This work is licensed under a Creative Commons Attribution 4.0 International License.
Jurnal HOAQ (High Education of Organization Archive Quality) : Jurnal Teknologi Informasi diterbitkan berdasarkan lisensi Creative Commons Attribution 4.0 International License (CC BY 4.0). Lisensi ini memungkinkan setiap orang untuk Berbagi: menyalin dan mendistribusikan kembali materi ini dalam format atau bentuk apapun; Adaptasi: merombak, mengubah, dan membuat turunan dari materi ini untuk keperluan apa pun, termasuk keperluan komersial, asalkan mereka memberikan pengakuan kepada Penulis Asli atas hasil karya aslinya.











