Penerapan Metode Vector Space Model TF-IDF dan Cosine Similarity pada Sistem Temu Balik Informasi Berita

Authors

  • Adinda Pangestu Universitas Amikom Purwokerto
  • Rias Estriana Universitas Amikom Purwokerto
  • Rahma Wati Universitas Amikom Purwokerto
  • Aldrian Firmansyah Universitas Amikom Purwokerto
  • Muhammad Fahat Universitas Amikom Purwokerto
  • Aulia Safira Universitas Nahdlatul Ulama Al Ghazali Cilacap
  • Toik Zakiyudin Universitas Amikom Purwokerto

DOI:

https://doi.org/10.63547/jiite.v3i1.109
Abstract View: 0,

Keywords:

Sistem Temu Balik Informasi, Vector Space Model, TF-IDF , Cosine Similarity, Berita Daring

Abstract

Perkembangan pesat media berita daring menyebabkan peningkatan volume dokumen teks yang signifikan, sehingga menimbulkan permasalahan information overload dalam proses pencarian informasi. Pengguna sering mengalami kesulitan menemukan berita yang relevan karena banyaknya dokumen yang memiliki kemiripan kata, namun tidak selalu sesuai dengan konteks kebutuhan informasi. Oleh karena itu, diperlukan suatu sistem temu balik informasi yang mampu melakukan pencarian dan pemeringkatan dokumen berita secara akurat berdasarkan tingkat relevansi konten. Penelitian ini bertujuan untuk menerapkan metode Vector Space Model (VSM) dengan pembobotan Term Frequency–Inverse Document Frequency (TF-IDF) serta pengukuran kemiripan menggunakan Cosine Similarity pada sistem temu balik informasi berita berbahasa Indonesia. Pendekatan penelitian yang digunakan adalah pendekatan kuantitatif dengan metode content-based information retrieval. Data penelitian berupa kumpulan dokumen berita daring yang diproses melalui tahapan preprocessing teks, meliputi case folding, tokenisasi, stopword removal, dan stemming, untuk menghasilkan data teks yang bersih dan seragam. Setiap dokumen kemudian direpresentasikan dalam bentuk vektor numerik menggunakan VSM dan diberi bobot TF-IDF untuk menonjolkan istilah yang bersifat spesifik terhadap topik dokumen. Tingkat kemiripan antara kueri pengguna dan dokumen berita dihitung menggunakan Cosine Similarity, yang selanjutnya digunakan sebagai dasar pemeringkatan dokumen. Hasil penelitian menunjukkan bahwa integrasi VSM, TF-IDF, dan Cosine Similarity mampu meningkatkan relevansi hasil pencarian dan menyajikan dokumen berita secara terstruktur sesuai dengan kebutuhan pengguna. Dengan demikian, sistem yang dikembangkan dapat menjadi solusi efektif dalam pencarian informasi berita berbasis teks serta berpotensi diterapkan pada koleksi dokumen berskala besar.

Published

2026-04-30

How to Cite

Pangestu, A., Estriana, R., Wati, R., Firmansyah, A., Fahat, M., Safira, A., & Zakiyudin, T. (2026). Penerapan Metode Vector Space Model TF-IDF dan Cosine Similarity pada Sistem Temu Balik Informasi Berita. Journal of Informatics and Interactive Technology, 3(1), 478–486. https://doi.org/10.63547/jiite.v3i1.109

Issue

Section

Articles