Aplicación del factor TF-IDF en el análisis semántico de una colección documental

Andrés Vuotto, Celeste Bogetti, Gladys Fernández

Resumen


Objetivo. Describe la aplicación de una herramienta para el análisis semántico de una colección documental, basada en el uso de la frecuencia de término – frecuencia inversa de documento (TF-IDF). Metodología. Se desarrolla un sistema, basado en lenguaje PHP y bases de datos MySQL, para la gestión de un tesauro, del cálculo TF-IDF (como indicador de peso semántico) y para el desarrollo de un árbol de relevancia (conformado por aquellos conceptos más relevantes del tema analizado). Se evaluó la herramienta en el análisis semántico de una colección documental de Psicología Resultados. El sistema logró identificar el nivel de presencia del tema: deontología profesional, en una colección los documentos del programa de Psicología. Conclusiones. La experiencia descrita confirma la viabilidad de la herramienta para el análisis semántico de una colección documental. Destaca la pertinencia y las capacidades de los profesionales de la información para el desarrollo de herramientas para el tratamiento de información. Los autores sugieren un especial abordaje técnico a partir del uso de scripts y de flujos de la información.

Palabras clave


Análisis semántico; TF-IDF; Recuperación de información; Minería de datos; Extracción de información en bases de datos

Texto completo:

PDF


DOI: https://doi.org/10.5195/biblios.2015.227

Enlaces refback

  • No hay ningún enlace refback.




Copyright (c) 2015 Andrés Vuotto, Celeste Bogetti, Gladys Fernández

URL de la licencia: https://creativecommons.org/licenses/by/4.0/us/