Penerapan Metode Vector Space Model TF-IDF dan Cosine Similarity pada Sistem Temu Balik Informasi Berita
DOI:
https://doi.org/10.63547/jiite.v3i1.109
Keywords:
Sistem Temu Balik Informasi, Vector Space Model, TF-IDF , Cosine Similarity, Berita DaringAbstract
Perkembangan pesat media berita daring menyebabkan peningkatan volume dokumen teks yang signifikan, sehingga menimbulkan permasalahan information overload dalam proses pencarian informasi. Pengguna sering mengalami kesulitan menemukan berita yang relevan karena banyaknya dokumen yang memiliki kemiripan kata, namun tidak selalu sesuai dengan konteks kebutuhan informasi. Oleh karena itu, diperlukan suatu sistem temu balik informasi yang mampu melakukan pencarian dan pemeringkatan dokumen berita secara akurat berdasarkan tingkat relevansi konten. Penelitian ini bertujuan untuk menerapkan metode Vector Space Model (VSM) dengan pembobotan Term Frequency–Inverse Document Frequency (TF-IDF) serta pengukuran kemiripan menggunakan Cosine Similarity pada sistem temu balik informasi berita berbahasa Indonesia. Pendekatan penelitian yang digunakan adalah pendekatan kuantitatif dengan metode content-based information retrieval. Data penelitian berupa kumpulan dokumen berita daring yang diproses melalui tahapan preprocessing teks, meliputi case folding, tokenisasi, stopword removal, dan stemming, untuk menghasilkan data teks yang bersih dan seragam. Setiap dokumen kemudian direpresentasikan dalam bentuk vektor numerik menggunakan VSM dan diberi bobot TF-IDF untuk menonjolkan istilah yang bersifat spesifik terhadap topik dokumen. Tingkat kemiripan antara kueri pengguna dan dokumen berita dihitung menggunakan Cosine Similarity, yang selanjutnya digunakan sebagai dasar pemeringkatan dokumen. Hasil penelitian menunjukkan bahwa integrasi VSM, TF-IDF, dan Cosine Similarity mampu meningkatkan relevansi hasil pencarian dan menyajikan dokumen berita secara terstruktur sesuai dengan kebutuhan pengguna. Dengan demikian, sistem yang dikembangkan dapat menjadi solusi efektif dalam pencarian informasi berita berbasis teks serta berpotensi diterapkan pada koleksi dokumen berskala besar.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2026 Journal of Informatics and Interactive Technology

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.










