Definiendo los datos de investigación en geociencias a través de la reutilización demetadatos:
un estudio de caso del repositorio de datos PANGEA
DOI:
https://doi.org/10.5195/biblios.2024.1233Palabras clave:
Datos de investigación, Reutilización de datos de investigación, Metadatos, Repositorio de datos de investigación, Raspado Web de Datos, GeocienciasResumen
Objetivo. Los datos de investigación se refieren a registros factuales utilizados como recursos primarios de investigación científica. La reutilización de metadatos de datos de investigación proporciona una nueva perspectiva, permitiendo la presentación de nuevas pruebas, hipótesis y nuevos desarrollos de investigación. Este estudio pretende identificar la naturaleza de los tipos de datos de investigación en Geociencias a partir de la reutilización de metadatos del PANGEA Data Publisher for Earth and Environmental Science disponible en (https://www.pangaea.de/). La pregunta de investigación a analizar es ¿Pueden los procesos de análisis y manipulación de metadatos de datos de investigación PANGEA utilizarse para definir un concepto de datos de investigación en Geociencias? Para abordar esta pregunta, se consideraron los atributos de especificación de datos utilizados por las revistas de datos para describir la naturaleza de los datos de investigación: dominio de especialización, accesibilidad, idioma, tipo de datos, adquisición, ubicación de la fuente, área temática específica y publicaciones relacionadas.
Método. La metodología involucró la recolección, análisis y visualización de metadatos de datos de investigación de PANGEA. En total, se descargaron (426,272) registros del repositorio de datos y se compararon con las especificaciones de datos utilizadas por las revistas para describir los datos en los artículos.La metodología en cuestión consistió en recopilar, analizar y visualizar los metadatos de datos de investigación de PANGEA. En total, se descargaron (426.272) registros del repositorio de datos y se compararon con las especificaciones de datos utilizadas por las revistas de datos para describir la naturaleza de los datos de investigación en los documentos de datos. La metodología requirió la aplicación de técnicas y tecnologías utilizadas para el análisis descriptivo, la recuperación de información, la manipulación de datos y la visualización de metadatos Dublin Core. Estas técnicas se implementaron utilizando el lenguaje de programación Python y otros software de manipulación de datos, incluyendo OpenRefine y VOSviewer.
Resultados. Los resultados de nuestro análisis sugieren un examen detallado de los metadatos de (137.218) registros de datos de investigación de (6) seis colecciones de Geociencias. El número de registros en la colección de Geoquímica es de (73.992), en la colección de Ciencias Atmosféricas es de (32.314), en la colección de Paleontología es de (25.903), en la colección de Oceanografía es de (22.287), en la colección de Geofísica es de (4.175), y en la colección de Hidrología, es de (834). Las (6) seis colecciones de metadatos de datos de investigación de PANGEA permiten discutir un concepto de datos de investigación en Geociencias como un tipo de datos sobre estudios relacionados con la Tierra, la atmósfera y los océanos, a través de diferentes geo-disciplinas. Los datos proceden de una serie de disciplinas, como la geoquímica, la ciencia atmosférica, la paleontología, la oceanografía, la geofísica y la hidrología, y utilizan tecnologías como los satélites, los microscopios electrónicos, sensores climáticos, barcos de investigaciones, modelos informáticos y otros. Además, los datos se complementan con otras fuentes relacionadas con el estudio de la Tierra y sus procesos.
Conclusiones. En conclusión, los metadatos de datos de investigación son objetos específicos de un dominio que sirven como valiosos recursos de investigación, independientemente de su momento de uso, finalidad, características de los datos o usuario. Los datos de investigación en geociencias combinan técnicas de laboratorio y de campo, utilizando tecnologías como los satélites y sensores climáticos para estudiar los procesos de la Tierra. Los metadatos PANGEA definen los datos de investigación en geociencias como observaciones, experimentos y modelización. Los datos de investigación en geociencias apoyan la réplica, la reinterpretación y la nueva investigación entre disciplinas, mostrando varias facetas de la reutilización de datos en la investigación científica.
Citas
Backus, G. E. (1996). Foundations of Geophysics. Cambridge University Press.
Bienhold, C.; & Boetius, A. (2015). Porosity in sediment sores from the Central Arctic Ocean during POLARSTERN cruise ARK-XXVII/3 from August-September 2012 [Dataset]. PANGAEA. https://doi.org/10.1594/PANGAEA.849054
Borgman, C. L. (2012). The conundrum of sharing research data. Journal of the American Society for Information Science and Technology, 63(6), 1059-1078; 2012. https://doi.org/10.1002/asi.22634.
Clarkke, F. W. (1924). The data of Geochemistry (5th ed.). United States Geological Survey, Washington Government Printing Office. https://pubs.usgs.gov/bul/0770/report.pdf
Daniels, M. G. (2014). Data reuse in museum contexts: Experiences of archaeologists and botanists [Dissertation]. University of Michigan. http://hdl.handle.net/2027.42/108953
Federer, L.; Lu, Y.; Joubert, D.; Welsh, J. & Brandys, B. (2015, june). Biomedical data sharing and reuse: Attitudes and practices of clinical and scientific research staff. PLOS One. https://10.1371/journal.pone.0129506
Felden, J.; Möller, L.; Schindler, U. et al. (2023). PANGAEA - Data Publisher for Earth & Environmental Science. Sci Data, 10(347). https://doi.org/10.1038/s41597-023-02269-x
Fetter, C. W. (1994). Applied hydrogeology (3rd ed.). Prentice Hall.
Foote, M.; & Miller, A. (2007). Principles of paleontology (3rd ed.). Freeman and Company.
Garrison, T. (2017). Fundamentos de oceanografia. Cengage.
Gastaldello, M.; Agnini, C., Westerhold, T.; Drury, A.; & Alegret, L. (2024). Age model, carbonate mass accumulation rates and benthic foraminifera from ODP Site 175-1085 [Dataset bundled publication]. PANGAEA. https://doi.org/10.1594/PANGAEA.962075
Giertz, S.; & Diekkrüger, B. (2003). Discharge data derived from five water level gauges and discharge measurements in the Aguima and Niaou catchment [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.831196
Gould, S. J. (2002). The structure of evolutionary theory. Belknap Press. https://archive.org/details/TheStructureOfEvolutionaryTheory
Jiao, C.; & Darch, P. T. (2020). The role of the data paper in scholarly communication. Proc Assoc Inf Sci Technol, 57, e316. https://doi.org/10.1002/pra2.316
Jiao, H.; Qiu, Y.; Ma, X.; & Yang, B. (2024). Dissemination effect of data papers on scientific datasets. Journal of the Association for Information Science and Technology, 75(2), 115-131. https://doi.org/10.1002/asi.24843
Jones, P.; Wheeler, D.; Können, G.; Koek, F.; Prieto, M.; & García-Herrera, R. (2007). Climatological observations from ship logbooks between 1750 and 1854 (release 2.1) [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.611088
Jones, R. W. (2011). Applications of paleontology: Techniques and case studies. Cambridge University Press.
Kaleschke, L.; & Müller, G. (2022). Sea ice drift from autonomous measurements from 15 buoys, deployed during the IRO2/SMOSIce field campaign in the Barents Sea March 2014 [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.941334
Keller, E. A.; & Devecchio, D. (2019). Introduction to Environmental Geology. Pearson.
Kim, J. (2020). An analysis of data paper templates and guidelines: Types of contextual information described by data journals. Science Editing, 7(1), 16-23.
Köppen, W. (1931). Grundriss der Klimakunde: Outline of climate science. Walter de Gruyter & Co. https://api.pageplace.de/preview/DT0400.9783111667751_A40793869/preview-9783111667751_A40793869.pdf
Li, K.; & Jiao, C. (2022). The data paper as a sociolinguistic epistemic object: A content analysis on the rhetorical moves used in data paper abstracts. Journal of the Association for Information Science and Technology, 73(6), 834-846. https://doi.org/10.1002/asi.24585
Lyell, C. (1853). Principles of Geology: The modern changes of the earth and its inhabitants (9th ed.). Little, Brown and Company. https://archive.org/details/principlesgeolo00lyelgoog/page/n5/mode/2up
O’Nions, R. K.; Hamilton, P. J.; & Evensen, N. M. (1977). Nd- and Sr- isotope ratios of oceanic basalts [Dataset publication series]. PANGAEA. https://doi.org/10.1594/PANGAEA.721776
Pampel, H. et al. (2013, november 4). Making research data repositories visible: The re3data.org registry. PLOS One. https://doi.org/10.1371/journal.pone.0078080
Phillips, M. (2013). Metadata Analysis at the Command-Line. Code4Lib, 19. https://journal.code4lib.org/articles/7818
Rice, R.; & Southall, S. (2016). The data librarian’s handbook. Facet Publishing.
Rohli, R.; & Viega, A. (2008). Climatology. Jones and Bartlett.
Semeler, A. R. (2024). Reuse of metadata Pangea Data Publisher for Earth & Environmental Science Repository [Dataset]. OSF. osf.io/3bsx2
Shutsko, A.; & Stock, W. (2023). Information scientists’ motivations for research data sharing and reuse. Libri, 73(4), 307-320. https://doi.org/10.1515/libri-2023-0052
Tarbuck, E. J.; Lutgens, F. K.; & Tasa, D. (2015). Earth Science. Pearson.
Tenopir, C. et al. (2015). Changes in data sharing and data reuse practices and perceptions among scientists worldwide. PLOS One, 10(8), e0134826. https://doi.org/10.1371/journal.pone.0134826
Uzwyshyn, R. (2016, april). Research data repositories: The what, when, why, and how. Computers In Libraries, 36(3), 18-21. https://www.researchgate.net/publication/304780954_Online_Research_Data_Repositories_the_What_When_Why_and_How
Van de Sandt, S.; Dallmeier-Tiessen, S.; Lavasa, A.; & Petras, V. (2019). The definition of reuse. Data Science Journal, 18(1), Article 22, 1-19. https://doi.org/10.5334/dsj-2019-022
Walters, W. H. (2020). Data journals: incentivizing data access and documentation within the scholarly communication system. Insights: the UKSG journal, 33, Article 18, 1-20. https://doi.org/10.1629/uksg.510
White, W. M. (2013). Geochemistry. Wiley-Blackwell.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2025 Alexandre Ribas Semeler, Luana Farias Sales, Adilson Luiz Pinto, Roberta Pereira da Silva de Paula, Valquer Cleyton Paes Gandra , Heloisa Costa
![Creative Commons License](http://i.creativecommons.org/l/by/4.0/88x31.png)
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Los autores que publican en esta revista están de acuerdo en los siguientes términos:
- El Autor retiene los Derechos sobre su Obra, donde el término "Obra" incluirá todos los objetos digitales que pueden resultar de la publicación electrónica posterior y/o distribución.
- Una vez aceptada la Obra, el Autor concede a la Editorial el derecho de la primera publicación de la Obra.
- Además el Autor le concederá a la Editorial y sus agentes el derecho permanente no exclusivo y licencia para publicar, archivar y hacer accesible la obra en su totalidad o en parte, en todas las formas de los medios ahora conocidos o en el futuro, bajo una Licencia Creative Commons de Reconocimiento 4.0 Internacional o su equivalente que, para evitar cualquier duda, permite a otros copiar, distribuir y comunicar públicamente la obra bajo la condición siguiente:
Reconocimiento - otros usuarios deben reconocer los créditos de la Obra de la manera especificada por el Autor o como se indica en el sitio web de la revista;
Entendido de que esta condición pueda ser modificada con permiso del Autor y que, cuando la Obra o cualquiera de sus elementos se halle en el dominio público según la legislación aplicable, que su estatus no esté en absoluto afectado por la licencia. - El Autor es capaz de entrar en acuerdos contractuales independientes, adicionales para la distribución no exclusiva de la versión de la Obra publicada en la revista (por ejemplo, publicarla en un repositorio institucional o publicarla en un libro) siempre y cuando se proporcione en el documento un reconocimiento de su publicación inicial en esta revista científica.
- A los Autores se les permite y apoya a publicar en línea un manuscrito previo (pero no la versión final de la Obra formateada en PDF para la Editorial), en repositorios institucionales o en sus páginas web, antes y durante el proceso de envío, ya que puede dar lugar a intercambios productivos, y a una citación más temprana del trabajo publicado. Dicha Obra después de su aceptación y publicación se deberá actualizar, incluyendo la referencia DOI (Digital Object Identifier) asignada por la Editorial y el enlace al resumen en línea de la versión final publicada en la revista.
- A petición de la Editorial, el Autor se compromete a comunicar y presentar oportunamente al Editor, por cuenta del mismo, las pruebas escritas de los permisos, licencias y autorizaciones para el uso de material de terceros incluido en la Obra, excepto lo determinado por la Editorial a cubrirse por los principios de uso justo.
- El Autor declara y garantiza que:
a. La Obra es un trabajo original del Autor;
b. El Autor no ha transferido y no transferirá, los derechos exclusivos sobre la Obra a un tercero;
c. La Obra no está en evaluación en otra revista científica;
d. La Obra no fue publicada en otra revista científica;
e. La Obra no contiene ninguna tergiversación o infracción al trabajo propiedad de otros autores o terceros, y
f. La Obra no contiene ninguna difamación, invasión de la privacidad, o cualquier otro asunto ilegal. - El Autor se compromete a indemnizar y eximir a la Editorial del incumplimiento por parte del Autor de las declaraciones y garantías contenidas en el párrafo 7 anterior, así como de cualquier reclamación o procedimiento relacionado con el uso y la publicación de la Editorial de cualquier contenido de la Obra, incluido el contenido de terceros.