Definiendo los datos de investigación en geociencias a través de la reutilización demetadatos:

un estudio de caso del repositorio de datos PANGEA

Autores/as

DOI:

https://doi.org/10.5195/biblios.2024.1233

Palabras clave:

Datos de investigación, Reutilización de datos de investigación, Metadatos, Repositorio de datos de investigación, Raspado Web de Datos, Geociencias

Resumen

Objetivo. Los datos de investigación se refieren a registros factuales utilizados como recursos primarios de investigación científica. La reutilización de metadatos de datos de investigación proporciona una nueva perspectiva, permitiendo la presentación de nuevas pruebas, hipótesis y nuevos desarrollos de investigación. Este estudio pretende identificar la naturaleza de los tipos de datos de investigación en Geociencias a partir de la reutilización de metadatos del PANGEA Data Publisher for Earth and Environmental Science disponible en (https://www.pangaea.de/). La pregunta de investigación a analizar es ¿Pueden los procesos de análisis y manipulación de metadatos de datos de investigación PANGEA utilizarse para definir un concepto de datos de investigación en Geociencias? Para abordar esta pregunta, se consideraron los atributos de especificación de datos utilizados por las revistas de datos para describir la naturaleza de los datos de investigación: dominio de especialización, accesibilidad, idioma, tipo de datos, adquisición, ubicación de la fuente, área temática específica y publicaciones relacionadas.

Método. La metodología involucró la recolección, análisis y visualización de metadatos de datos de investigación de PANGEA. En total, se descargaron (426,272) registros del repositorio de datos y se compararon con las especificaciones de datos utilizadas por las revistas para describir los datos en los artículos.La metodología en cuestión consistió en recopilar, analizar y visualizar los metadatos de datos de investigación de PANGEA. En total, se descargaron (426.272) registros del repositorio de datos y se compararon con las especificaciones de datos utilizadas por las revistas de datos para describir la naturaleza de los datos de investigación en los documentos de datos. La metodología requirió la aplicación de técnicas y tecnologías utilizadas para el análisis descriptivo, la recuperación de información, la manipulación de datos y la visualización de metadatos Dublin Core. Estas técnicas se implementaron utilizando el lenguaje de programación Python y otros software de manipulación de datos, incluyendo OpenRefine y VOSviewer.

Resultados. Los resultados de nuestro análisis sugieren un examen detallado de los metadatos de (137.218) registros de datos de investigación de (6) seis colecciones de Geociencias. El número de registros en la colección de Geoquímica es de (73.992), en la colección de Ciencias Atmosféricas es de (32.314), en la colección de Paleontología es de (25.903), en la colección de Oceanografía es de (22.287), en la colección de Geofísica es de (4.175), y en la colección de Hidrología, es de (834). Las (6) seis colecciones de metadatos de datos de investigación de PANGEA permiten discutir un concepto de datos de investigación en Geociencias como un tipo de datos sobre estudios relacionados con la Tierra, la atmósfera y los océanos, a través de diferentes geo-disciplinas. Los datos proceden de una serie de disciplinas, como la geoquímica, la ciencia atmosférica, la paleontología, la oceanografía, la geofísica y la hidrología, y utilizan tecnologías como los satélites, los microscopios electrónicos, sensores climáticos, barcos de investigaciones, modelos informáticos y otros. Además, los datos se complementan con otras fuentes relacionadas con el estudio de la Tierra y sus procesos.

Conclusiones. En conclusión, los metadatos de datos de investigación son objetos específicos de un dominio que sirven como valiosos recursos de investigación, independientemente de su momento de uso, finalidad, características de los datos o usuario. Los datos de investigación en geociencias combinan técnicas de laboratorio y de campo, utilizando tecnologías como los satélites y sensores climáticos para estudiar los procesos de la Tierra. Los metadatos PANGEA definen los datos de investigación en geociencias como observaciones, experimentos y modelización. Los datos de investigación en geociencias apoyan la réplica, la reinterpretación y la nueva investigación entre disciplinas, mostrando varias facetas de la reutilización de datos en la investigación científica.

Biografía del autor/a

Alexandre Ribas Semeler, Universidade Federal do Rio Grande do Sul

Actualmente trabajo como bibliotecario de datos en el Instituto de Geociencias de la Universidad Federal de Rio Grande do Sul en Brasil. Como investigador independiente y bibliotecario de datos, tengo un interés interdisciplinar en la biblioteconomía de datos. Creo en el cuarto paradigma de las ciencias (e-ciencia y humanidades digitales) y considero que las actuales tecnologías de datos digitales son importantes motores de transformación en las bibliotecas académicas.

Luana Farias Sales, Instituto Brasileiro de Informação em Ciência e Tecnologia

Doctora en Ciencia de la Información por el Programa de Postgrado IBICT/UFRJ (2011-2014). Máster en Ciencia de la Información por el convenio UFF/IBICT (2004-2006), Licenciada en Biblioteconomía y Documentación por la Universidad Federal Fluminense (2003). Becaria Pq-B Productividad. Joven Científica del Estado de Río de Janeiro. Es Analista C & T en MCTI/IBICT, enseñando en el Programa de Posgrado en Ciencia de la Información en el convenio IBICT-UFRJ y en DIECI - División de Publicaciones Científicas. Es Coordinadora General de la oficina GO FAIR Brasil.

Adilson Luiz Pinto, Universidade Federal de Santa Catarina

Licenciada en Biblioteconomía por la PUC-Campinas (2000), Máster en Ciencia de la Información por la PUC-Campinas (2004) y en Documentación Audiovisual por la Universidad Carlos III de Madrid (2006); Doctora en Documentación por la Universidad Carlos III de Madrid (2007). Miembro del Laboratorio LEMME y Líder de Estudios Métricos en Biblioteconomía de Datos y Geociencias; Editor de la Revista Iberoamericana de Medición y Comunicación de la Ciencia.

Roberta Pereira da Silva de Paula, Instituto Brasileiro de Informação em Ciência e Tecnologia

Estudiante de doctorado en Ciencias de la Información en el PPGCI - IBICT/UFRJ (Inicio 2020). Máster en Ciencia de la Información por el Convenio IBICT/UFF (2007). Graduada en Biblioteconomía (2004) y Especialista en Organización del Conocimiento para Recuperación de Información (2005) por la UNIRIO. Actualmente es Jefa de Biblioteca del Servicio Geológico de Brasil.

Valquer Cleyton Paes Gandra , Instituto Brasileiro de Informação em Ciência e Tecnologia

Estudiante de Máster en Ciencias de la Información en PPGCI IBICT-UFRJ. Postgrado en Diseño de Productos Digitales UI y UX por UNOPAR. Licenciado en Biblioteconomía por UNIRIO. Estudiante de Postgrado en Ciencia de Datos por UNOPAR. Diplomado en Acceso a la Información Científica y Tecnológica en Salud por el ICICT-FIOCRUZ.

Heloisa Costa, Universidade Federal de Santa Catarina

Es licenciada en Biblioteconomía por la Universidad Federal de Santa Catarina (UFSC), especialista en Gestión de Unidades de Información por la Universidad Estatal de Santa Catarina (UDESC), doctora y máster en Ciencia de la Información por la UFSC, en el Programa de Postgrado en Ciencia de la Información (PGCIN-UFSC). Es profesora suplente en el Departamento de Ciencias de la Información de la Universidad Federal de Santa Catarina. Tiene experiencia como consultora en gestión de acervos documentales y bibliográficos y en el área de Ciencia de la Información, con énfasis en gestión de unidades de información y gestión de documentos. También revisa documentos y trabajos académicos, incluyendo la normalización de la ABNT.

Citas

Backus, G. E. (1996). Foundations of Geophysics. Cambridge University Press.

Bienhold, C.; & Boetius, A. (2015). Porosity in sediment sores from the Central Arctic Ocean during POLARSTERN cruise ARK-XXVII/3 from August-September 2012 [Dataset]. PANGAEA. https://doi.org/10.1594/PANGAEA.849054

Borgman, C. L. (2012). The conundrum of sharing research data. Journal of the American Society for Information Science and Technology, 63(6), 1059-1078; 2012. https://doi.org/10.1002/asi.22634.

Clarkke, F. W. (1924). The data of Geochemistry (5th ed.). United States Geological Survey, Washington Government Printing Office. https://pubs.usgs.gov/bul/0770/report.pdf

Daniels, M. G. (2014). Data reuse in museum contexts: Experiences of archaeologists and botanists [Dissertation]. University of Michigan. http://hdl.handle.net/2027.42/108953

Federer, L.; Lu, Y.; Joubert, D.; Welsh, J. & Brandys, B. (2015, june). Biomedical data sharing and reuse: Attitudes and practices of clinical and scientific research staff. PLOS One. https://10.1371/journal.pone.0129506

Felden, J.; Möller, L.; Schindler, U. et al. (2023). PANGAEA - Data Publisher for Earth & Environmental Science. Sci Data, 10(347). https://doi.org/10.1038/s41597-023-02269-x

Fetter, C. W. (1994). Applied hydrogeology (3rd ed.). Prentice Hall.

Foote, M.; & Miller, A. (2007). Principles of paleontology (3rd ed.). Freeman and Company.

Garrison, T. (2017). Fundamentos de oceanografia. Cengage.

Gastaldello, M.; Agnini, C., Westerhold, T.; Drury, A.; & Alegret, L. (2024). Age model, carbonate mass accumulation rates and benthic foraminifera from ODP Site 175-1085 [Dataset bundled publication]. PANGAEA. https://doi.org/10.1594/PANGAEA.962075

Giertz, S.; & Diekkrüger, B. (2003). Discharge data derived from five water level gauges and discharge measurements in the Aguima and Niaou catchment [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.831196

Gould, S. J. (2002). The structure of evolutionary theory. Belknap Press. https://archive.org/details/TheStructureOfEvolutionaryTheory

Jiao, C.; & Darch, P. T. (2020). The role of the data paper in scholarly communication. Proc Assoc Inf Sci Technol, 57, e316. https://doi.org/10.1002/pra2.316

Jiao, H.; Qiu, Y.; Ma, X.; & Yang, B. (2024). Dissemination effect of data papers on scientific datasets. Journal of the Association for Information Science and Technology, 75(2), 115-131. https://doi.org/10.1002/asi.24843

Jones, P.; Wheeler, D.; Können, G.; Koek, F.; Prieto, M.; & García-Herrera, R. (2007). Climatological observations from ship logbooks between 1750 and 1854 (release 2.1) [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.611088

Jones, R. W. (2011). Applications of paleontology: Techniques and case studies. Cambridge University Press.

Kaleschke, L.; & Müller, G. (2022). Sea ice drift from autonomous measurements from 15 buoys, deployed during the IRO2/SMOSIce field campaign in the Barents Sea March 2014 [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.941334

Keller, E. A.; & Devecchio, D. (2019). Introduction to Environmental Geology. Pearson.

Kim, J. (2020). An analysis of data paper templates and guidelines: Types of contextual information described by data journals. Science Editing, 7(1), 16-23.

Köppen, W. (1931). Grundriss der Klimakunde: Outline of climate science. Walter de Gruyter & Co. https://api.pageplace.de/preview/DT0400.9783111667751_A40793869/preview-9783111667751_A40793869.pdf

Li, K.; & Jiao, C. (2022). The data paper as a sociolinguistic epistemic object: A content analysis on the rhetorical moves used in data paper abstracts. Journal of the Association for Information Science and Technology, 73(6), 834-846. https://doi.org/10.1002/asi.24585

Lyell, C. (1853). Principles of Geology: The modern changes of the earth and its inhabitants (9th ed.). Little, Brown and Company. https://archive.org/details/principlesgeolo00lyelgoog/page/n5/mode/2up

O’Nions, R. K.; Hamilton, P. J.; & Evensen, N. M. (1977). Nd- and Sr- isotope ratios of oceanic basalts [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.721776

Pampel, H. et al. (2013, november 4). Making research data repositories visible: The re3data.org registry. PLOS One. https://doi.org/10.1371/journal.pone.0078080

Phillips, M. (2013). Metadata Analysis at the Command-Line. Code4Lib, 19. https://journal.code4lib.org/articles/7818

Rice, R.; & Southall, S. (2016). The data librarian’s handbook. Facet Publishing.

Rohli, R.; & Viega, A. (2008). Climatology. Jones and Bartlett.

Semeler, A. R. (2024). Reuse of metadata Pangea Data Publisher for Earth & Environmental Science Repository [Dataset]. OSF. osf.io/3bsx2

Shutsko, A.; & Stock, W. (2023). Information scientists’ motivations for research data sharing and reuse. Libri, 73(4), 307-320. https://doi.org/10.1515/libri-2023-0052

Tarbuck, E. J.; Lutgens, F. K.; & Tasa, D. (2015). Earth Science. Pearson.

Tenopir, C. et al. (2015). Changes in data sharing and data reuse practices and perceptions among scientists worldwide. PLOS One, 10(8), e0134826. https://doi.org/10.1371/journal.pone.0134826

Uzwyshyn, R. (2016, april). Research data repositories: The what, when, why, and how. Computers In Libraries, 36(3), 18-21. https://www.researchgate.net/publication/304780954_Online_Research_Data_Repositories_the_What_When_Why_and_How

Van de Sandt, S.; Dallmeier-Tiessen, S.; Lavasa, A.; & Petras, V. (2019). The definition of reuse. Data Science Journal, 18(1), Article 22, 1-19. https://doi.org/10.5334/dsj-2019-022

Walters, W. H. (2020). Data journals: incentivizing data access and documentation within the scholarly communication system. Insights: the UKSG journal, 33, Article 18, 1-20. https://doi.org/10.1629/uksg.510

White, W. M. (2013). Geochemistry. Wiley-Blackwell.

Descargas

Publicado

07-02-2025

Cómo citar

Semeler, A. R., Sales, L. F., Pinto, A. L., Paula, R. P. da S. de, Gandra , V. C. P., & Costa, H. (2025). Definiendo los datos de investigación en geociencias a través de la reutilización demetadatos: : un estudio de caso del repositorio de datos PANGEA. Biblios Journal of Librarianship and Information Science, (87), e009. https://doi.org/10.5195/biblios.2024.1233