Definindo dados de pesquisa em geociências por meio da reutilização de metadados:
um estudo de casosobre o repositório de dados PANGEA
DOI:
https://doi.org/10.5195/biblios.2024.1233Palavras-chave:
Dados de pesquisa, Reutilização de dados de pesquisa, Repositório de dados de pesquisa, Extração de dados da web, Geociências, metadadosResumo
Objetivo. Dados de pesquisa referem-se a registros factuais usados como recursos primários para pesquisas científicas. A reutilização de metadados de dados de pesquisa fornece uma nova perspectiva, permitindo a apresentação de novas evidências, hipóteses e novos desenvolvimentos de pesquisa.Este estudo pretende identificar a natureza dos tipos de dados de pesquisa em Geociências a partir da reutilização de metadados do PANGEA Data Publisher for Earth and Environmental Science, disponível em (https://www.pangaea.de/). A questão de pesquisa busca compreender se os processos de análise e manipulação de metadados de dados de pesquisa do PANGEA podem ser usados para definir um conceito de dados de pesquisa em Geociências? Para responder a essa pergunta, consideramos os atributos de especificação de dados usados pelos periódicos de dados para descrever a natureza dos dados de pesquisa, como: domínio de especialização, acessibilidade, idioma, tipo de dados, aquisição, local de origem, área de assunto específica e publicações relacionadas.
Método. No total, (426.272) registros foram baixados do PANGEA e comparados com as especificações de dados usadas pelos periódicos de dados para descrever a natureza dos dados de pesquisa nos artigos de dados. A metodologia exigiu a aplicação de técnicas e tecnologias usadas para análise descritiva, recuperação de informações, manipulação de dados e visualização dos metadados do Dublin Core. Essas técnicas foram implementadas usando a linguagem de programação Python e outros softwares de manipulação de dados, incluindo o OpenRefine e o VOSviewer.
Resultados. Os resultados de nossa análise sugerem um exame detalhado de 137.218 registros de metadados de dados de pesquisa em 6 coleções de dados sobre Geociências. O número de registros na coleção de Geoquímica é de 73.992, na coleção Ciências Atmosféricas é de 32.314, na coleção Palaeontologia é de 25.903, na coleção Oceanografia é de 22.287, na coleção Geofisica é de 4.175 e na coleção Hidrologia é de 834. As 6 coleções de metadados de dados de pesquisa do PANGEA permitem discutir um conceito de dados de pesquisa em Geociências como um tipo de dados sobre estudos relacionados à Terra, à atmosfera e aos oceanos, em diferentes geodisciplinas. Os dados vêm de diversas disciplinas, como geoquímica, ciência atmosférica, paleontologia, oceanografia, geofísica e hidrologia, e são o resultado do uso de diversas tecnologias como como satélites, microscópios eletrônicos, sensores climáticos, navios de pesquisa, modelos de computador entre outros. Além disso, os dados são complementados por outras fontes relacionadas aos estudos da Terra e de seus processos.
Conclusões. Concluindo, os metadados de dados de pesquisa são objetos específicos de domínios e servem como valiosos recursos de pesquisa, independentemente do tempo de uso, da finalidade, das características dos dados ou dos usuários. Os dados de pesquisa em geociências combinam técnicas de laboratório e de campo, usando tecnologias como os satélites e sensores climáticos para estudar os processos da Terra. Os metadados do PANGEA definem os dados de pesquisa em geociências como observações, experimentos e modelagem. Os dados de pesquisa em geociências apoiam a replicação, a reinterpretação e novas pesquisas entre disciplinas, mostrando várias facetas da reutilização de dados na pesquisa científica.
Referências
Backus, G. E. (1996). Foundations of Geophysics. Cambridge University Press.
Bienhold, C.; & Boetius, A. (2015). Porosity in sediment sores from the Central Arctic Ocean during POLARSTERN cruise ARK-XXVII/3 from August-September 2012 [Dataset]. PANGAEA. https://doi.org/10.1594/PANGAEA.849054
Borgman, C. L. (2012). The conundrum of sharing research data. Journal of the American Society for Information Science and Technology, 63(6), 1059-1078; 2012. https://doi.org/10.1002/asi.22634.
Clarkke, F. W. (1924). The data of Geochemistry (5th ed.). United States Geological Survey, Washington Government Printing Office. https://pubs.usgs.gov/bul/0770/report.pdf
Daniels, M. G. (2014). Data reuse in museum contexts: Experiences of archaeologists and botanists [Dissertation]. University of Michigan. http://hdl.handle.net/2027.42/108953
Federer, L.; Lu, Y.; Joubert, D.; Welsh, J. & Brandys, B. (2015, june). Biomedical data sharing and reuse: Attitudes and practices of clinical and scientific research staff. PLOS One. https://10.1371/journal.pone.0129506
Felden, J.; Möller, L.; Schindler, U. et al. (2023). PANGAEA - Data Publisher for Earth & Environmental Science. Sci Data, 10(347). https://doi.org/10.1038/s41597-023-02269-x
Fetter, C. W. (1994). Applied hydrogeology (3rd ed.). Prentice Hall.
Foote, M.; & Miller, A. (2007). Principles of paleontology (3rd ed.). Freeman and Company.
Garrison, T. (2017). Fundamentos de oceanografia. Cengage.
Gastaldello, M.; Agnini, C., Westerhold, T.; Drury, A.; & Alegret, L. (2024). Age model, carbonate mass accumulation rates and benthic foraminifera from ODP Site 175-1085 [Dataset bundled publication]. PANGAEA. https://doi.org/10.1594/PANGAEA.962075
Giertz, S.; & Diekkrüger, B. (2003). Discharge data derived from five water level gauges and discharge measurements in the Aguima and Niaou catchment [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.831196
Gould, S. J. (2002). The structure of evolutionary theory. Belknap Press. https://archive.org/details/TheStructureOfEvolutionaryTheory
Jiao, C.; & Darch, P. T. (2020). The role of the data paper in scholarly communication. Proc Assoc Inf Sci Technol, 57, e316. https://doi.org/10.1002/pra2.316
Jiao, H.; Qiu, Y.; Ma, X.; & Yang, B. (2024). Dissemination effect of data papers on scientific datasets. Journal of the Association for Information Science and Technology, 75(2), 115-131. https://doi.org/10.1002/asi.24843
Jones, P.; Wheeler, D.; Können, G.; Koek, F.; Prieto, M.; & García-Herrera, R. (2007). Climatological observations from ship logbooks between 1750 and 1854 (release 2.1) [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.611088
Jones, R. W. (2011). Applications of paleontology: Techniques and case studies. Cambridge University Press.
Kaleschke, L.; & Müller, G. (2022). Sea ice drift from autonomous measurements from 15 buoys, deployed during the IRO2/SMOSIce field campaign in the Barents Sea March 2014 [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.941334
Keller, E. A.; & Devecchio, D. (2019). Introduction to Environmental Geology. Pearson.
Kim, J. (2020). An analysis of data paper templates and guidelines: Types of contextual information described by data journals. Science Editing, 7(1), 16-23.
Köppen, W. (1931). Grundriss der Klimakunde: Outline of climate science. Walter de Gruyter & Co. https://api.pageplace.de/preview/DT0400.9783111667751_A40793869/preview-9783111667751_A40793869.pdf
Li, K.; & Jiao, C. (2022). The data paper as a sociolinguistic epistemic object: A content analysis on the rhetorical moves used in data paper abstracts. Journal of the Association for Information Science and Technology, 73(6), 834-846. https://doi.org/10.1002/asi.24585
Lyell, C. (1853). Principles of Geology: The modern changes of the earth and its inhabitants (9th ed.). Little, Brown and Company. https://archive.org/details/principlesgeolo00lyelgoog/page/n5/mode/2up
O’Nions, R. K.; Hamilton, P. J.; & Evensen, N. M. (1977). Nd- and Sr- isotope ratios of oceanic basalts [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.721776
Pampel, H. et al. (2013, november 4). Making research data repositories visible: The re3data.org registry. PLOS One. https://doi.org/10.1371/journal.pone.0078080
Phillips, M. (2013). Metadata Analysis at the Command-Line. Code4Lib, 19. https://journal.code4lib.org/articles/7818
Rice, R.; & Southall, S. (2016). The data librarian’s handbook. Facet Publishing.
Rohli, R.; & Viega, A. (2008). Climatology. Jones and Bartlett.
Semeler, A. R. (2024). Reuse of metadata Pangea Data Publisher for Earth & Environmental Science Repository [Dataset]. OSF. osf.io/3bsx2
Shutsko, A.; & Stock, W. (2023). Information scientists’ motivations for research data sharing and reuse. Libri, 73(4), 307-320. https://doi.org/10.1515/libri-2023-0052
Tarbuck, E. J.; Lutgens, F. K.; & Tasa, D. (2015). Earth Science. Pearson.
Tenopir, C. et al. (2015). Changes in data sharing and data reuse practices and perceptions among scientists worldwide. PLOS One, 10(8), e0134826. https://doi.org/10.1371/journal.pone.0134826
Uzwyshyn, R. (2016, april). Research data repositories: The what, when, why, and how. Computers In Libraries, 36(3), 18-21. https://www.researchgate.net/publication/304780954_Online_Research_Data_Repositories_the_What_When_Why_and_How
Van de Sandt, S.; Dallmeier-Tiessen, S.; Lavasa, A.; & Petras, V. (2019). The definition of reuse. Data Science Journal, 18(1), Article 22, 1-19. https://doi.org/10.5334/dsj-2019-022
Walters, W. H. (2020). Data journals: incentivizing data access and documentation within the scholarly communication system. Insights: the UKSG journal, 33, Article 18, 1-20. https://doi.org/10.1629/uksg.510
White, W. M. (2013). Geochemistry. Wiley-Blackwell.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2025 Alexandre Ribas Semeler, Luana Farias Sales, Adilson Luiz Pinto, Roberta Pereira da Silva de Paula, Valquer Cleyton Paes Gandra , Heloisa Costa
![Creative Commons License](http://i.creativecommons.org/l/by/4.0/88x31.png)
Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Os autores que publicam neste periódico estão de acordo nos seguintes termos:
- O Autor retém o Direito sobre a sua Obra, onde o termo "Obra" incluirá todos os objetos digitais que podem resultar da publicação eletrônica posterior e/ou distribuição.
- Uma vez aceitada a Obra, o Autor concede à Editorial o direito da primeira publicação da Obra.
- O Autor lhe concederá à Editorial e seus agentes o direito permanente não exclusivo e licença para publicar, arquivar e fazer acessível a Obra em sua totalidade ou em parte, em todas as formas e os meios agora conhecidos ou no futuro, mediante uma Licença Creative Commons Atribuição 4.0 Internacional ou seu equivalente que, para evitar qualquer dúvida, permite a outros copiar, distribuir e comunicar publicamente a Obra nas condições seguintes: Atribuição - outros usuários devem reconhecer a Obra da forma especificada pelo Autor ou como se indica no lugar web do periódico científico; Entendendo que esta condição possa ser modificada com a licença do Autor e que, quando a Obra ou qualquer de seus elementos se ache no domínio público segundo a legislação aplicável, que seu status não esteja em absoluto afetado pela licença.
- O Autor é capaz de entrar em acordos contratuais independentes, adicionais para a distribuição não exclusiva da versão da Obra publicada no periódico científico (por exemplo, publicá-la num repositório institucional ou publicá-la num livro) sempre que se proporcione no documento um reconhecimento de sua publicação inicial neste periódico científico.
- Os Autores estão autorizados e tem o apoio para publicar em linha um manuscrito antes da sua publicação (mas não a versão final da Obra formatada em PDF para a Editorial) em repositórios institucionais ou em seu sitio, antes e durante o processo de envio, já que pode dar lugar a intercâmbios produtivos, e a uma citação primigênia maior do trabalho publicado (ver o efeito do acesso aberto). Dita Obra depois de sua aceitação e publicação se deverá atualizar, incluindo a referência DOI (Digital Object Identifier) atribuída pela Editorial e o vínculo ao resumo em linha da versão final publicada no periódico.
- A petição da Editorial, o Autor se compromete a comunicar e apresentar oportunamente ao Editor, e por conta dele, as provas escritas das permissões, licenças e autorizações para o uso de material de terceiros incluso na Obra, exceto o determinado pela Editorial a cobrir-se pelos princípios de uso justo.
- O Autor declara e garante que:
a. A Obra é um trabalho original do Autor;
b. O Autor não transferiu e não transferirá, os direitos exclusivos sobre a Obra para um terceiro;
c. A Obra não está em avaliação em outro periódico científico;
d. A Obra não foi publicada em outro periódico científico;
e. A Obra não contém nenhuma tergiversação ou infração ao trabalho propriedade de outros autores ou terceiros, e
f. A Obra não contém nenhuma difamação, invasão da privacidade, ou qualquer outro assunto ilegal. - O Autor se compromete a indenizar e eximir à Editorial se não cumprir com as declarações e garantias contidas no parágrafo 7 anterior, assim como de qualquer reclamação ou procedimento relacionado com o uso e a publicação da Editorial de qualquer conteúdo da Obra, incluído o conteúdo de terceiros.