Aplicação do fator TF-IDF na análise semântica de uma coleção documental
DOI:
https://doi.org/10.5195/biblios.2015.227Palavras-chave:
Análise semântica, TF-IDF, Recuperação de informação, Mineração de dados, Extração de informação em base de dadosResumo
Objetivo. Descreve a aplicação de uma ferramenta para a análise semântica de uma coleção documentária, baseada em o uso da frequência de termo – frequência inversa de documento (TF-IDF). Metodologia. Desenvolve-se um sistema, baseado em linguagem PHP e base de dados MySQL, para o gerenciamento de um tesauro, do cálculo TF-IDF (como indicador da importância semântica) e para o desenvolvimento de uma árvore de relevância (conformado por aqueles conceitos mais relevantes do tema analisado). Avaliou-se a ferramenta na análise semântica de uma coleção documentária de Psicologia. Resultados. O sistema conseguiu identificar o nível de presença do tema: deontologia profissional, em uma coleção os documentos do programa de Psicologia. Conclusões. A experiência descrita confirma a viabilidade da ferramenta para a análise semântica de uma coleção documentária. Destaca a pertinência e as capacidades dos profissionais da informação para o desenvolvimento de ferramentas para o tratamento de informação. Os autores sugerem uma especial abordagem técnica a partir do uso de scripts e de fluxos da informação.Downloads
Publicado
2015-11-24
Como Citar
Vuotto, A., Bogetti, C., & Fernández, G. (2015). Aplicação do fator TF-IDF na análise semântica de uma coleção documental. Biblios Journal of Librarianship and Information Science, (60), 1–13. https://doi.org/10.5195/biblios.2015.227
Edição
Seção
Original
Licença
Os autores que publicam neste periódico estão de acordo nos seguintes termos:
- O Autor retém o Direito sobre a sua Obra, onde o termo "Obra" incluirá todos os objetos digitais que podem resultar da publicação eletrônica posterior e/ou distribuição.
- Uma vez aceitada a Obra, o Autor concede à Editorial o direito da primeira publicação da Obra.
- O Autor lhe concederá à Editorial e seus agentes o direito permanente não exclusivo e licença para publicar, arquivar e fazer acessível a Obra em sua totalidade ou em parte, em todas as formas e os meios agora conhecidos ou no futuro, mediante uma Licença Creative Commons Atribuição 4.0 Internacional ou seu equivalente que, para evitar qualquer dúvida, permite a outros copiar, distribuir e comunicar publicamente a Obra nas condições seguintes: Atribuição - outros usuários devem reconhecer a Obra da forma especificada pelo Autor ou como se indica no lugar web do periódico científico; Entendendo que esta condição possa ser modificada com a licença do Autor e que, quando a Obra ou qualquer de seus elementos se ache no domínio público segundo a legislação aplicável, que seu status não esteja em absoluto afetado pela licença.
- O Autor é capaz de entrar em acordos contratuais independentes, adicionais para a distribuição não exclusiva da versão da Obra publicada no periódico científico (por exemplo, publicá-la num repositório institucional ou publicá-la num livro) sempre que se proporcione no documento um reconhecimento de sua publicação inicial neste periódico científico.
- Os Autores estão autorizados e tem o apoio para publicar em linha um manuscrito antes da sua publicação (mas não a versão final da Obra formatada em PDF para a Editorial) em repositórios institucionais ou em seu sitio, antes e durante o processo de envio, já que pode dar lugar a intercâmbios produtivos, e a uma citação primigênia maior do trabalho publicado (ver o efeito do acesso aberto). Dita Obra depois de sua aceitação e publicação se deverá atualizar, incluindo a referência DOI (Digital Object Identifier) atribuída pela Editorial e o vínculo ao resumo em linha da versão final publicada no periódico.
- A petição da Editorial, o Autor se compromete a comunicar e apresentar oportunamente ao Editor, e por conta dele, as provas escritas das permissões, licenças e autorizações para o uso de material de terceiros incluso na Obra, exceto o determinado pela Editorial a cobrir-se pelos princípios de uso justo.
- O Autor declara e garante que:
a. A Obra é um trabalho original do Autor;
b. O Autor não transferiu e não transferirá, os direitos exclusivos sobre a Obra para um terceiro;
c. A Obra não está em avaliação em outro periódico científico;
d. A Obra não foi publicada em outro periódico científico;
e. A Obra não contém nenhuma tergiversação ou infração ao trabalho propriedade de outros autores ou terceiros, e
f. A Obra não contém nenhuma difamação, invasão da privacidade, ou qualquer outro assunto ilegal. - O Autor se compromete a indenizar e eximir à Editorial se não cumprir com as declarações e garantias contidas no parágrafo 7 anterior, assim como de qualquer reclamação ou procedimento relacionado com o uso e a publicação da Editorial de qualquer conteúdo da Obra, incluído o conteúdo de terceiros.