Implementasi Metode K-Nearest Neighbor pada Pendeteksian Spam Opinion (Junk Post) dalam Forum (doi:10.34820/FK2/DOAFOM)

View:

Part 1: Document Description
Part 2: Study Description
Part 5: Other Study-Related Materials
Entire Codebook

Document Description

Citation

Title:

Implementasi Metode K-Nearest Neighbor pada Pendeteksian Spam Opinion (Junk Post) dalam Forum

Identification Number:

doi:10.34820/FK2/DOAFOM

Distributor:

Telkom University Dataverse

Date of Distribution:

2023-10-02

Version:

1

Bibliographic Citation:

adi, Yudhi Nugroho, 2023, "Implementasi Metode K-Nearest Neighbor pada Pendeteksian Spam Opinion (Junk Post) dalam Forum", https://doi.org/10.34820/FK2/DOAFOM, Telkom University Dataverse, V1

Study Description

Citation

Title:

Implementasi Metode K-Nearest Neighbor pada Pendeteksian Spam Opinion (Junk Post) dalam Forum

Identification Number:

doi:10.34820/FK2/DOAFOM

Authoring Entity:

adi, Yudhi Nugroho (Telkom University)

Distributor:

Telkom University Dataverse

Access Authority:

adi, Yudhi Nugroho

Depositor:

adi, Yudhi Nugroho

Date of Deposit:

2022-03-08

Study Scope

Keywords:

Computer and Information Science, text classification, junk post, k-nearest neighbor, pearson correlation distance, tf-idf.

Abstract:

Masalah utama dari sebuah forum adalah adanya pengguna yang sering mengomentari suatu thread atau topik tetapi apa yang dikomentari tidak berguna atau tidak berhubungan sama sekali dengan isi thread atau topik tersebut. Komentar atau postingan seperti ini dikenal dengan junk post. Banyak sekali kerugian akibat adanya junk post, diantaranya adalah menambah halaman topik tersebut yang mengakibatkan user lain sulit untuk membaca seluruh topik serta menambah waktu membaca forum, mengubah arah pembicaraan sehingga bisa berkembang junk post lainnya dari user lain, pokok topik yang penting bisa dikaburkan oleh junk post sehingga ada beberapa hal yang terlewat, dan berbagai macam masalah lainnya. <br> Untuk itulah penilitian ini bertujuan untuk mengklasifikasikan suatu postingan atau komentar termasuk junk atau tidak, sehingga diharapkan kedepannya dapat mengurangi junk post pada forum internet. Metode yang akan digunakan untuk penelitian ini adalah dengan menggunakan metode K-Nearest Neighbor untuk pengklasifikasian teks. Dalam penerapannya, dilakukan juga pembobotan postingan dengan tf-idf dan untuk menghitung nilai similarity dari postingan yang ada dengan thread atau topik yang berkaitan menggunakan Pearson Correlation Distance. <br> Hasil dari penelitian ini menunjukkan bahwa nilai f1-measure yang didapat untuk skenario pengujian 1 adalah 70.71% dengan jumlah k=93, untuk skenario pengujian 2 adalah 70.00% dengan jumlah k=61, dan untuk skenario pengujian 3 adalah 71.72% dengan jumlah k=41. Pada masing-masing skenario, f1-measure yang lebih baik dihasilkan ketika tidak menggunakan stop word removal. Hal ini di karenakan postingan dalam forum bersifat tidak baku dan memiliki kata yang sangat variatif sehingga kurang cocok apabila stop word removal digunakan pada penelitian ini.<br> text classification, junk post, k-nearest neighbor, pearson correlation distance, tf-idf.

Methodology and Processing

Sources Statement

Data Access

Notes:

CC0 Waiver

Other Study Description Materials

Other Study-Related Materials

Label:

113118032_jurnal.pdf

Notes:

application/pdf