EXPERIMENTO DE RECUPERACIÓN DE INFORMACIÓN USANDO LAS MEDIDAS DE SIMILITUD COSENO, JACCARD Y DICE

Authors

  • LUZ STELLA GARCÍA MONSALVE Universidad ECCI

Keywords:

Lenguaje natural, recuperación de información, métricas.

Abstract

Con frecuencia resulta extremadamente dispendioso e incluso se puede pensar que físicamente es imposible recuperar información de otra manera que no sea automáticamente, debido al gran volumen de ésta, además, este proceso trae como consecuencia que al no ser preciso, la información relevante será ignorada por el afán de hacer el trabajo rápidamente. [1] Hoy en dia es posible obtener mayores beneficios en dicho proceso de recuperación de información usando herramientas tecnológicas avanzadas diseñadas para tal fin. Tomando como referencia la colección documental de prueba ADI [12], se realizó un experimento que permitió almacenar en tablas los 82 documentos y las 35 consultas que ofrece la colección, para luego aplicar las técnicas de tokenización y stop words y calcular la frecuencia absoluta simple y la frecuencia inversa, para posteriormente hallar los resultados de los coeficientes Coseno, Jaccard y Dice, compararlos y determinar cuál de ellos tiene la mayor precisión.

Published

2012-01-26

How to Cite

GARCÍA MONSALVE, L. S. . (2012). EXPERIMENTO DE RECUPERACIÓN DE INFORMACIÓN USANDO LAS MEDIDAS DE SIMILITUD COSENO, JACCARD Y DICE. Tecciencia, 6(12), 14–24. Retrieved from https://tecciencia.ecci.edu.co/index.php/TECCIENCIA/article/view/16