Application of TF-IDF factor in the semantic analysis of a documentary collection

Authors

  • Andrés Vuotto Universidad Nacional de Mar del Plata - MDP
  • Celeste Bogetti Universidad Nacional de Mar del Plata - MDP
  • Gladys Fernández Universidad Nacional de Mar del Plata - MDP

DOI:

https://doi.org/10.5195/biblios.2015.227

Keywords:

Semantic analysis, TF - IDF, Information retrieval, Data mining, Knowledge discovery

Abstract

Objective. This paper describes the application of a tool for the semantic analysis of a document collection based on the use of term frequency–inverse document frequency (TF – IDF). Methodology. A system based on PHP and MySQL database for the management of a thesaurus, the calculation of TF – IDF (as an indicator of semantic weight) and for development a relevance tree (consisting of those concepts is developed most relevant issue analyzed). The tool was tested to the semantic analysis of a documentary collection of Psychology. Results. The system was able to identify the level of track presence: professional ethics, in a collection of documents Psychology program. Conclusions. The experience described confirms the viability of the tool for the semantic analysis of a documentary collection. It underlines the relevance and capacities of information professionals to develop this kind of tools for processing information. The authors suggests a special technical approach for use of scripts and information flows.

Author Biographies

Andrés Vuotto, Universidad Nacional de Mar del Plata - MDP

Jefe de Trabajos Prácticos con dedicación exclusiva a la docencia e investigación, perteneciente al área de Procesamiento de la Información, Departamento de Documentación, Universidad Nacional de Mar del Plata.

Celeste Bogetti, Universidad Nacional de Mar del Plata - MDP

Becaria en investigación por la Facultad de Psicología de la Universidad Nacional de Mar del Plata. Desde sus inicios como miembro del grupo de investigación PSICOLOGIA Y ETICA. CIENCIA Y PROFESION - OCA 1077/07 ha trabajado en las temáticas Formación y Ética profesional, como también Deontología profesional; con destacadas participaciones en congresos nacionales e internacionales y colaboraciones en publicaciones científicas del área.

Gladys Fernández, Universidad Nacional de Mar del Plata - MDP

Docente e investigadora del Departamento de Documentación de la Universidad Nacional de Mar del Plata, miembro del equipo de desarrollo de área de educación a distancia

Graduado y docente/investigador del Departamento de Documentación de la Universidad Nacional de Mar del Plata, trabajando en el área Procesamiento de la Información; siempre se dedicó al estudio de la aplicación de las nuevas tecnologías de la información para la representación, análisis y gestión documental; como también para el desarrollo y mejora de sistemas de educación a distancia bajo modalidad virtual.

Published

2015-11-24

How to Cite

Vuotto, A., Bogetti, C., & Fernández, G. (2015). Application of TF-IDF factor in the semantic analysis of a documentary collection. Biblios Journal of Librarianship and Information Science, (60), 1–13. https://doi.org/10.5195/biblios.2015.227

Issue

Section

Original