Implementasi Metode K-Nearest Neighbor pada Pendeteksian Spam Opinion (Junk Post) dalam Forum (doi:10.34820/FK2/DOAFOM)

View:

Part 1: Document Description
Part 2: Study Description
Part 5: Other Study-Related Materials
Entire Codebook

Document Description
Citation
Title:	Implementasi Metode K-Nearest Neighbor pada Pendeteksian Spam Opinion (Junk Post) dalam Forum
Identification Number:	doi:10.34820/FK2/DOAFOM
Distributor:	Telkom University Dataverse
Date of Distribution:	2023-10-02
Version:	1
Bibliographic Citation:	adi, Yudhi Nugroho, 2023, "Implementasi Metode K-Nearest Neighbor pada Pendeteksian Spam Opinion (Junk Post) dalam Forum", https://doi.org/10.34820/FK2/DOAFOM, Telkom University Dataverse, V1
Study Description
Citation
Title:	Implementasi Metode K-Nearest Neighbor pada Pendeteksian Spam Opinion (Junk Post) dalam Forum
Identification Number:	doi:10.34820/FK2/DOAFOM
Authoring Entity:	adi, Yudhi Nugroho (Telkom University)
Distributor:	Telkom University Dataverse
Access Authority:	adi, Yudhi Nugroho
Depositor:	adi, Yudhi Nugroho
Date of Deposit:	2022-03-08
Study Scope
Keywords:	Computer and Information Science, text classification, junk post, k-nearest neighbor, pearson correlation distance, tf-idf.
Abstract:	Masalah utama dari sebuah forum adalah adanya pengguna yang sering mengomentari suatu thread atau topik tetapi apa yang dikomentari tidak berguna atau tidak berhubungan sama sekali dengan isi thread atau topik tersebut. Komentar atau postingan seperti ini dikenal dengan junk post. Banyak sekali kerugian akibat adanya junk post, diantaranya adalah menambah halaman topik tersebut yang mengakibatkan user lain sulit untuk membaca seluruh topik serta menambah waktu membaca forum, mengubah arah pembicaraan sehingga bisa berkembang junk post lainnya dari user lain, pokok topik yang penting bisa dikaburkan oleh junk post sehingga ada beberapa hal yang terlewat, dan berbagai macam masalah lainnya. <br> Untuk itulah penilitian ini bertujuan untuk mengklasifikasikan suatu postingan atau komentar termasuk junk atau tidak, sehingga diharapkan kedepannya dapat mengurangi junk post pada forum internet. Metode yang akan digunakan untuk penelitian ini adalah dengan menggunakan metode K-Nearest Neighbor untuk pengklasifikasian teks. Dalam penerapannya, dilakukan juga pembobotan postingan dengan tf-idf dan untuk menghitung nilai similarity dari postingan yang ada dengan thread atau topik yang berkaitan menggunakan Pearson Correlation Distance. <br> Hasil dari penelitian ini menunjukkan bahwa nilai f1-measure yang didapat untuk skenario pengujian 1 adalah 70.71% dengan jumlah k=93, untuk skenario pengujian 2 adalah 70.00% dengan jumlah k=61, dan untuk skenario pengujian 3 adalah 71.72% dengan jumlah k=41. Pada masing-masing skenario, f1-measure yang lebih baik dihasilkan ketika tidak menggunakan stop word removal. Hal ini di karenakan postingan dalam forum bersifat tidak baku dan memiliki kata yang sangat variatif sehingga kurang cocok apabila stop word removal digunakan pada penelitian ini.<br> text classification, junk post, k-nearest neighbor, pearson correlation distance, tf-idf.
Methodology and Processing
Sources Statement
Data Access
Notes:	CC0 Waiver
Other Study Description Materials
Other Study-Related Materials
Label:	113118032_jurnal.pdf
Notes:	application/pdf