Aplicação do fator TF-IDF na análise semântica de uma coleção documental

Autores

  • Andrés Vuotto Universidad Nacional de Mar del Plata - MDP
  • Celeste Bogetti Universidad Nacional de Mar del Plata - MDP
  • Gladys Fernández Universidad Nacional de Mar del Plata - MDP

DOI:

https://doi.org/10.5195/biblios.2015.227

Palavras-chave:

Análise semântica, TF-IDF, Recuperação de informação, Mineração de dados, Extração de informação em base de dados

Resumo

Objetivo. Descreve a aplicação de uma ferramenta para a análise semântica de uma coleção documentária, baseada em o uso da frequência de termo – frequência inversa de documento (TF-IDF). Metodologia. Desenvolve-se um sistema, baseado em linguagem PHP e base de dados MySQL, para o gerenciamento de um tesauro, do cálculo TF-IDF (como indicador da importância semântica) e para o desenvolvimento de uma árvore de relevância (conformado por aqueles conceitos mais relevantes do tema analisado). Avaliou-se a ferramenta na análise semântica de uma coleção documentária de Psicologia. Resultados. O sistema conseguiu identificar o nível de presença do tema: deontologia profissional, em uma coleção os documentos do programa de Psicologia. Conclusões. A experiência descrita confirma a viabilidade da ferramenta para a análise semântica de uma coleção documentária. Destaca a pertinência e as capacidades dos profissionais da informação para o desenvolvimento de ferramentas para o tratamento de informação. Os autores sugerem uma especial abordagem técnica a partir do uso de scripts e de fluxos da informação.

Biografia do Autor

Andrés Vuotto, Universidad Nacional de Mar del Plata - MDP

Jefe de Trabajos Prácticos con dedicación exclusiva a la docencia e investigación, perteneciente al área de Procesamiento de la Información, Departamento de Documentación, Universidad Nacional de Mar del Plata.

Celeste Bogetti, Universidad Nacional de Mar del Plata - MDP

Becaria en investigación por la Facultad de Psicología de la Universidad Nacional de Mar del Plata. Desde sus inicios como miembro del grupo de investigación PSICOLOGIA Y ETICA. CIENCIA Y PROFESION - OCA 1077/07 ha trabajado en las temáticas Formación y Ética profesional, como también Deontología profesional; con destacadas participaciones en congresos nacionales e internacionales y colaboraciones en publicaciones científicas del área.

Gladys Fernández, Universidad Nacional de Mar del Plata - MDP

Docente e investigadora del Departamento de Documentación de la Universidad Nacional de Mar del Plata, miembro del equipo de desarrollo de área de educación a distancia

Graduado y docente/investigador del Departamento de Documentación de la Universidad Nacional de Mar del Plata, trabajando en el área Procesamiento de la Información; siempre se dedicó al estudio de la aplicación de las nuevas tecnologías de la información para la representación, análisis y gestión documental; como también para el desarrollo y mejora de sistemas de educación a distancia bajo modalidad virtual.

Publicado

2015-11-24

Como Citar

Vuotto, A., Bogetti, C., & Fernández, G. (2015). Aplicação do fator TF-IDF na análise semântica de uma coleção documental. Biblios Journal of Librarianship and Information Science, (60), 1–13. https://doi.org/10.5195/biblios.2015.227

Edição

Seção

Original