Aplicación del factor TF-IDF en el análisis semántico de una colección documental

Autores/as

  • Andrés Vuotto Universidad Nacional de Mar del Plata - MDP
  • Celeste Bogetti Universidad Nacional de Mar del Plata - MDP
  • Gladys Fernández Universidad Nacional de Mar del Plata - MDP

DOI:

https://doi.org/10.5195/biblios.2015.227

Palabras clave:

Análisis semántico, TF-IDF, Recuperación de información, Minería de datos, Extracción de información en bases de datos

Resumen

Objetivo. Describe la aplicación de una herramienta para el análisis semántico de una colección documental, basada en el uso de la frecuencia de término – frecuencia inversa de documento (TF-IDF). Metodología. Se desarrolla un sistema, basado en lenguaje PHP y bases de datos MySQL, para la gestión de un tesauro, del cálculo TF-IDF (como indicador de peso semántico) y para el desarrollo de un árbol de relevancia (conformado por aquellos conceptos más relevantes del tema analizado). Se evaluó la herramienta en el análisis semántico de una colección documental de Psicología Resultados. El sistema logró identificar el nivel de presencia del tema: deontología profesional, en una colección los documentos del programa de Psicología. Conclusiones. La experiencia descrita confirma la viabilidad de la herramienta para el análisis semántico de una colección documental. Destaca la pertinencia y las capacidades de los profesionales de la información para el desarrollo de herramientas para el tratamiento de información. Los autores sugieren un especial abordaje técnico a partir del uso de scripts y de flujos de la información.

Biografía del autor/a

Andrés Vuotto, Universidad Nacional de Mar del Plata - MDP

Jefe de Trabajos Prácticos con dedicación exclusiva a la docencia e investigación, perteneciente al área de Procesamiento de la Información, Departamento de Documentación, Universidad Nacional de Mar del Plata.

Celeste Bogetti, Universidad Nacional de Mar del Plata - MDP

Becaria en investigación por la Facultad de Psicología de la Universidad Nacional de Mar del Plata. Desde sus inicios como miembro del grupo de investigación PSICOLOGIA Y ETICA. CIENCIA Y PROFESION - OCA 1077/07 ha trabajado en las temáticas Formación y Ética profesional, como también Deontología profesional; con destacadas participaciones en congresos nacionales e internacionales y colaboraciones en publicaciones científicas del área.

Gladys Fernández, Universidad Nacional de Mar del Plata - MDP

Docente e investigadora del Departamento de Documentación de la Universidad Nacional de Mar del Plata, miembro del equipo de desarrollo de área de educación a distancia

Graduado y docente/investigador del Departamento de Documentación de la Universidad Nacional de Mar del Plata, trabajando en el área Procesamiento de la Información; siempre se dedicó al estudio de la aplicación de las nuevas tecnologías de la información para la representación, análisis y gestión documental; como también para el desarrollo y mejora de sistemas de educación a distancia bajo modalidad virtual.

Descargas

Publicado

24-11-2015

Cómo citar

Vuotto, A., Bogetti, C., & Fernández, G. (2015). Aplicación del factor TF-IDF en el análisis semántico de una colección documental. Biblios Journal of Librarianship and Information Science, (60), 1–13. https://doi.org/10.5195/biblios.2015.227

Número

Sección

Original