Definindo dados de pesquisa em geociências por meio da reutilização de metadados:

um estudo de casosobre o repositório de dados PANGEA

Autores

DOI:

https://doi.org/10.5195/biblios.2024.1233

Palavras-chave:

Dados de pesquisa, Reutilização de dados de pesquisa, Repositório de dados de pesquisa, Extração de dados da web, Geociências, metadados

Resumo

Objetivo. Dados de pesquisa referem-se a registros factuais usados como recursos primários para pesquisas científicas. A reutilização de metadados de dados de pesquisa fornece uma nova perspectiva, permitindo a apresentação de novas evidências, hipóteses e novos desenvolvimentos de pesquisa.Este estudo pretende identificar a natureza dos tipos de dados de pesquisa em Geociências a partir da reutilização de metadados do PANGEA Data Publisher for Earth and Environmental Science, disponível em (https://www.pangaea.de/). A questão de pesquisa busca compreender se os processos de análise e manipulação de metadados de dados de pesquisa do PANGEA podem ser usados para definir um conceito de dados de pesquisa em Geociências? Para responder a essa pergunta, consideramos os atributos de especificação de dados usados pelos periódicos de dados para descrever a natureza dos dados de pesquisa, como: domínio de especialização, acessibilidade, idioma, tipo de dados, aquisição, local de origem, área de assunto específica e publicações relacionadas.

Método. No total, (426.272) registros foram baixados do PANGEA e comparados com as especificações de dados usadas pelos periódicos de dados para descrever a natureza dos dados de pesquisa nos artigos de dados. A metodologia exigiu a aplicação de técnicas e tecnologias usadas para análise descritiva, recuperação de informações, manipulação de dados e visualização dos metadados do Dublin Core. Essas técnicas foram implementadas usando a linguagem de programação Python e outros softwares de manipulação de dados, incluindo o OpenRefine e o VOSviewer.

Resultados. Os resultados de nossa análise sugerem um exame detalhado de 137.218 registros de metadados de dados de pesquisa em 6 coleções de dados sobre Geociências. O número de registros na coleção de Geoquímica é de 73.992, na coleção Ciências Atmosféricas é de 32.314, na coleção Palaeontologia é de 25.903, na coleção Oceanografia é de 22.287, na coleção Geofisica é de 4.175 e na coleção Hidrologia é de 834. As 6 coleções de metadados de dados de pesquisa do PANGEA permitem discutir um conceito de dados de pesquisa em Geociências como um tipo de dados sobre estudos relacionados à Terra, à atmosfera e aos oceanos, em diferentes geodisciplinas. Os dados vêm de diversas disciplinas, como geoquímica, ciência atmosférica, paleontologia, oceanografia, geofísica e hidrologia, e são o resultado do uso de diversas tecnologias como como satélites, microscópios eletrônicos, sensores climáticos, navios de pesquisa, modelos de computador entre outros. Além disso, os dados são complementados por outras fontes relacionadas aos estudos da Terra e de seus processos.

Conclusões. Concluindo, os metadados de dados de pesquisa são objetos específicos de domínios e servem como valiosos recursos de pesquisa, independentemente do tempo de uso, da finalidade, das características dos dados ou dos usuários. Os dados de pesquisa em geociências combinam técnicas de laboratório e de campo, usando tecnologias como os satélites e sensores climáticos para estudar os processos da Terra. Os metadados do PANGEA definem os dados de pesquisa em geociências como observações, experimentos e modelagem. Os dados de pesquisa em geociências apoiam a replicação, a reinterpretação e novas pesquisas entre disciplinas, mostrando várias facetas da reutilização de dados na pesquisa científica.

Biografia do Autor

Alexandre Ribas Semeler, Federal University of Rio Grande do Sul

Atualmente, trabalho como bibliotecário de dados no Instituto de Geociências da Universidade Federal do Rio Grande do Sul, no Brasil. Como pesquisador independente e bibliotecário de dados, tenho um interesse interdisciplinar em biblioteconomia de dados. Acredito no quarto paradigma das ciências (e-science e humanidades digitais) e vejo as atuais tecnologias de dados digitais como grandes motores de transformação nas bibliotecas acadêmicas.

Luana Farias Sales, Instituto Brasileiro de Informação em Ciência e Tecnologia

Doutora em Ciência da Informação pelo Programa de Pós-Graduação do IBICT/UFRJ (2011-2014). Mestre em Ciência da Informação pelo convênio UFF/IBICT (2004-2006), Graduação em Biblioteconomia e Documentação pela Universidade Federal Fluminense (2003). Bolsista de Produtividade Pq-B. Jovem Cientista do Estado do Rio de Janeiro. É Analista em C & T do MCTI/IBICT, atuando como docente do Programa de Pós-graduação em Ciência da Informação do convênio IBICT-UFRJ e na DIECI - Divisão de Editoração Científica . É Coordenadora-Geral do office do GO FAIR Brasil.

Adilson Luiz Pinto, Universidade Federal de Santa Catarina

Graduado em Biblioteconomia pela PUC-Campinas (2000), Mestre em Ciência da Informação pela PUC-Campinas (2004) e em Documentação Audiovisual pela Universidad Carlos III de Madrid (2006); Doutor em Documentação pela Universidad Carlos III de Madrid (2007). Membro do LEMME Lab e Líder do Metric Studies in Data Librarianship and Geosciences; Editor da revista Iberoamerican Journal of Science Measurement and Communication.

Roberta Pereira da Silva de Paula, Instituto Brasileiro de Informação em Ciência e Tecnologia

Doutoranda em Ciência da Informação pelo PPGCI - IBICT/UFRJ (Início 2020). Mestre em Ciência da Informação pelo Convênio IBICT/UFF (2007). Graduada em Biblioteconomia (2004) e Especialista em Organização do Conhecimento para Recuperação da Informação (2005) pela UNIRIO. Atualmente é Chefe da Biblioteca do Serviço Geológico do Brasil.

Valquer Cleyton Paes Gandra , Instituto Brasileiro de Informação em Ciência e Tecnologia

Mestrando em Ciência da Informação pelo PPGCI IBICT-UFRJ. Pós-graduado em Design de Produtos digitais UI e UX pela UNOPAR. Bacharel em Biblioteconomia pela UNIRIO. Pós graduando em Ciência de dados pela UNOPAR. Qualificação em Acesso à Informação Científica e Tecnológica em Saúde pelo ICICT- FIOCRUZ.

Heloisa Costa, Universidade Federal de Santa Catarina

Possui graduação em Biblioteconomia pela Universidade Federal de Santa Catarina (UFSC), Especialização em Gestão de Unidades de Informação pela Universidade do Estado de Santa Catarina (UDESC), Doutorado e Mestrado em Ciência da Informação pela UFSC, no Programa de Pós-graduação em Ciência da Informação (PGCIN-UFSC). Atua como professora substituta no Departamento de Ciência da Informação da Universidade Federal de Santa Catarina. Possui experiência como consultora em gestão de acervos documentais e bibliográficos e na área de Ciência da Informação, com ênfase em gestão de unidades de informação e gestão de documentos. Atua como revisora de documentos e trabalhos acadêmicos, incluindo normalização ABNT.

Referências

Backus, G. E. (1996). Foundations of Geophysics. Cambridge University Press.

Bienhold, C.; & Boetius, A. (2015). Porosity in sediment sores from the Central Arctic Ocean during POLARSTERN cruise ARK-XXVII/3 from August-September 2012 [Dataset]. PANGAEA. https://doi.org/10.1594/PANGAEA.849054

Borgman, C. L. (2012). The conundrum of sharing research data. Journal of the American Society for Information Science and Technology, 63(6), 1059-1078; 2012. https://doi.org/10.1002/asi.22634.

Clarkke, F. W. (1924). The data of Geochemistry (5th ed.). United States Geological Survey, Washington Government Printing Office. https://pubs.usgs.gov/bul/0770/report.pdf

Daniels, M. G. (2014). Data reuse in museum contexts: Experiences of archaeologists and botanists [Dissertation]. University of Michigan. http://hdl.handle.net/2027.42/108953

Federer, L.; Lu, Y.; Joubert, D.; Welsh, J. & Brandys, B. (2015, june). Biomedical data sharing and reuse: Attitudes and practices of clinical and scientific research staff. PLOS One. https://10.1371/journal.pone.0129506

Felden, J.; Möller, L.; Schindler, U. et al. (2023). PANGAEA - Data Publisher for Earth & Environmental Science. Sci Data, 10(347). https://doi.org/10.1038/s41597-023-02269-x

Fetter, C. W. (1994). Applied hydrogeology (3rd ed.). Prentice Hall.

Foote, M.; & Miller, A. (2007). Principles of paleontology (3rd ed.). Freeman and Company.

Garrison, T. (2017). Fundamentos de oceanografia. Cengage.

Gastaldello, M.; Agnini, C., Westerhold, T.; Drury, A.; & Alegret, L. (2024). Age model, carbonate mass accumulation rates and benthic foraminifera from ODP Site 175-1085 [Dataset bundled publication]. PANGAEA. https://doi.org/10.1594/PANGAEA.962075

Giertz, S.; & Diekkrüger, B. (2003). Discharge data derived from five water level gauges and discharge measurements in the Aguima and Niaou catchment [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.831196

Gould, S. J. (2002). The structure of evolutionary theory. Belknap Press. https://archive.org/details/TheStructureOfEvolutionaryTheory

Jiao, C.; & Darch, P. T. (2020). The role of the data paper in scholarly communication. Proc Assoc Inf Sci Technol, 57, e316. https://doi.org/10.1002/pra2.316

Jiao, H.; Qiu, Y.; Ma, X.; & Yang, B. (2024). Dissemination effect of data papers on scientific datasets. Journal of the Association for Information Science and Technology, 75(2), 115-131. https://doi.org/10.1002/asi.24843

Jones, P.; Wheeler, D.; Können, G.; Koek, F.; Prieto, M.; & García-Herrera, R. (2007). Climatological observations from ship logbooks between 1750 and 1854 (release 2.1) [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.611088

Jones, R. W. (2011). Applications of paleontology: Techniques and case studies. Cambridge University Press.

Kaleschke, L.; & Müller, G. (2022). Sea ice drift from autonomous measurements from 15 buoys, deployed during the IRO2/SMOSIce field campaign in the Barents Sea March 2014 [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.941334

Keller, E. A.; & Devecchio, D. (2019). Introduction to Environmental Geology. Pearson.

Kim, J. (2020). An analysis of data paper templates and guidelines: Types of contextual information described by data journals. Science Editing, 7(1), 16-23.

Köppen, W. (1931). Grundriss der Klimakunde: Outline of climate science. Walter de Gruyter & Co. https://api.pageplace.de/preview/DT0400.9783111667751_A40793869/preview-9783111667751_A40793869.pdf

Li, K.; & Jiao, C. (2022). The data paper as a sociolinguistic epistemic object: A content analysis on the rhetorical moves used in data paper abstracts. Journal of the Association for Information Science and Technology, 73(6), 834-846. https://doi.org/10.1002/asi.24585

Lyell, C. (1853). Principles of Geology: The modern changes of the earth and its inhabitants (9th ed.). Little, Brown and Company. https://archive.org/details/principlesgeolo00lyelgoog/page/n5/mode/2up

O’Nions, R. K.; Hamilton, P. J.; & Evensen, N. M. (1977). Nd- and Sr- isotope ratios of oceanic basalts [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.721776

Pampel, H. et al. (2013, november 4). Making research data repositories visible: The re3data.org registry. PLOS One. https://doi.org/10.1371/journal.pone.0078080

Phillips, M. (2013). Metadata Analysis at the Command-Line. Code4Lib, 19. https://journal.code4lib.org/articles/7818

Rice, R.; & Southall, S. (2016). The data librarian’s handbook. Facet Publishing.

Rohli, R.; & Viega, A. (2008). Climatology. Jones and Bartlett.

Semeler, A. R. (2024). Reuse of metadata Pangea Data Publisher for Earth & Environmental Science Repository [Dataset]. OSF. osf.io/3bsx2

Shutsko, A.; & Stock, W. (2023). Information scientists’ motivations for research data sharing and reuse. Libri, 73(4), 307-320. https://doi.org/10.1515/libri-2023-0052

Tarbuck, E. J.; Lutgens, F. K.; & Tasa, D. (2015). Earth Science. Pearson.

Tenopir, C. et al. (2015). Changes in data sharing and data reuse practices and perceptions among scientists worldwide. PLOS One, 10(8), e0134826. https://doi.org/10.1371/journal.pone.0134826

Uzwyshyn, R. (2016, april). Research data repositories: The what, when, why, and how. Computers In Libraries, 36(3), 18-21. https://www.researchgate.net/publication/304780954_Online_Research_Data_Repositories_the_What_When_Why_and_How

Van de Sandt, S.; Dallmeier-Tiessen, S.; Lavasa, A.; & Petras, V. (2019). The definition of reuse. Data Science Journal, 18(1), Article 22, 1-19. https://doi.org/10.5334/dsj-2019-022

Walters, W. H. (2020). Data journals: incentivizing data access and documentation within the scholarly communication system. Insights: the UKSG journal, 33, Article 18, 1-20. https://doi.org/10.1629/uksg.510

White, W. M. (2013). Geochemistry. Wiley-Blackwell.

Downloads

Publicado

2025-02-07

Como Citar

Semeler, A. R., Sales, L. F., Pinto, A. L., Paula, R. P. da S. de, Gandra , V. C. P., & Costa, H. (2025). Definindo dados de pesquisa em geociências por meio da reutilização de metadados: : um estudo de casosobre o repositório de dados PANGEA. Biblios Journal of Librarianship and Information Science, (87), e009. https://doi.org/10.5195/biblios.2024.1233