• No se han encontrado resultados

¿Qué es la gestión de datos y cómo la relaciono con mi proyecto de investigación?

N/A
N/A
Protected

Academic year: 2023

Share "¿Qué es la gestión de datos y cómo la relaciono con mi proyecto de investigación?"

Copied!
92
0
0

Texto completo

(1)

Rebeca Marín

https://orcid.org/0000-0002-0010-1544

Eva Ortiz Uceta

https://orcid.org/0000-0002-3630-6373

Costa Rica

28 septiembre 2022

¿Qué es la gestión de datos y cómo la

relaciono con mi proyecto de

investigación?

(2)

1. Presentación.

2. ¿Qué son los datos de investigación?

3. Políticas.

4. Ciclo de vida de los datos de investigación.

5. Preparar un Plan de Gestión de Datos.

6. Buenas prácticas sobre el tratamiento de ficheros a depositar: nombres, formatos, protección de datos personales.

7. Reutilizar y compartir: licencias de uso.

8. Difusión de datos finales.

9. Ejemplos de uso: Consorcio Madroño

10. Material de apoyo.

Contenidos:

(3)

1. Presentación

(4)

http://hdl.handle.net/10016/27182

(5)

El Consorcio de Universidades de la Comunidad de Madrid y la UNED para la

Cooperación Bibliotecaria (Madroño) tiene como objetivo fundamental incrementar la

producción científica de sus universidades, mejorando la calidad de los servicios

bibliotecarios y promoviendo planes de cooperación entre sus miembros.

(6)

2. ¿Qué son los datos de

investigación?

(7)

@hacklib

(8)

● Son datos:

encuestas, muestreos, imágenes, vídeos, secuencias genéticas, cromatogramas, modelos climáticos, diseños, bases de datos, modelos en 3D, piezas arqueológicas, testimonios orales,...

Es decir, aquellos materiales generados o recolectados durante el transcurso de la realización de una investigación. Son la base de la evidencia científica sobre la que los investigadores construyen su trabajo.

Dataset es un conjunto de datos.

(9)
(10)

Todos los datos de la secuencia generados por el Proyecto Genoma Humano han sido depositados rápidamente en las bases de datos públicos y puestos libremente a disposición de los científicos en el mundo, sin restricciones en cuanto a su uso o redistribución.[...]

“Desde el comienzo, uno de los principios operativos del Proyecto Genoma Humano ha sido que los datos y los recursos que ha generado son puestos rápidamente a disposición de toda la comunidad científica,"

expresó el Dr. Robert Waterston, de la Universidad de Washington, Seattle. "No sólo la inmediata liberación de los datos promueve los mejores intereses de la ciencia, también lleva al máximo los beneficios que el público recibe de dicha investigación”.

https://www.genome.gov/11510908/consorcio-internacional-completa-el-proyecto-genoma-humano

PRINCIPIOS DE BERMUDAS

Imagen: https://pixabay.com/es/illustrations/microbiolog%C3%ADa-adn-personas-163521/

Genoma

Humano

(11)

Datos de investigación en abierto Open Research Data

Da ta sharing

(12)

Fuente: http://hdl.handle.net/10016/29545

(13)

Recomendación de la UNESCO sobre la Ciencia Abierta (2021). https://unesdoc.unesco.org/ark:/48223/pf0000379949_spa

(14)

¿Por qué son importantes los datos de investigación en abierto?

- Verifican los resultados de investigación.

- Permiten su reutilización (también por los autores).

- Ahorro de costes al evitar duplicar los esfuerzos.

- Aumenta la credibilidad de la ciencia, pues hace patente la inversión pública en investigación.

- Cumplen los requerimientos de los financiadores (dinero público).

- Mejora de la transparencia.

- Aumenta la visibilidad y el impacto de la investigación.

- Potencial como acelerador de la investigación. Permite la prueba de métodos nuevos o alternativos.

- Permiten actuar de forma más rápida y eficiente en situaciones como epidemias: COVID-19

- Favorecen establecer nuevos contactos entre colegas, impulsando la colaboración.

- Preservación.

- Etc.

(15)
(16)

¿Reticencias por parte del personal investigador?

- Falta de tiempo.

- Prioridad de publicar artículos, etc.

- Falta de infraestructuras, personal experto.

- Cláusulas de confidencialidad.

- etc.

(17)

Reproducibilidad

- Reproducción: recreación de un estudio utilizando el entorno, los datos y la metodología originales.

- Replicación: recreación más general, utilizando el mismo método de análisis pero con diferentes conjuntos de datos.

- Reutilización: volver a utilizar los datos de forma más flexible más allá del contexto de la investigación original.

Méndez, E., Bautista-Puig, N. (2022). Open Science: Observations for Universities as Agents of Paradigm Change. New Visions for Higher Education towards 2030 - Part 2: Transitions:

Key Topics, Key Voices. https://www.guni-call4action.org/sites/default/files/2022-05/Eva%20Me%7Fndez%20and%20Nu%7Fria%20Bautista-Puig%20.pdf

(18)

https://mobile.twitter.com/JaimeObregon/status/1434926939878264832

Reproducción (mismos datos, mismo método):

Replicación (distintos datos, mismo método):

Reutilización:

Transpar encia,

rig or

Fiabilidad

Sos tenibilidad, equidad, e

tc.

Datos abiertos de investigación

FAIR

(19)

El orden de las siglas responde a una secuencia lógica.

4 principios establecidos por Force11.

Establecen cómo deben ser los datos para ser compartidos.

(20)

F indable = Fáciles de encontrar

Los datos deben de ser fáciles de localizar/encontrar.

I nteroperable

A ccessible = accesible

R eusable = reutilizable

Una vez encontrados, debemos poder acceder a

ellos.

Ha de ser posible interpretarlos y trabajar con

ellos.

Puedan ser reutilizados.

Datos y metadatos han de tener identificador único y persistente (DOI).

Datos descritos con metadatos enriquecidos.

Deben existir metadatos específicos para el identificador persistente.

Datos y metadatos han de estar registrados o indexados en sistemas con motor de búsqueda.

Datos y metadatos pueden ser recuperables con su identificador mediante protocolos estandarizados.

Protocolos abiertos, gratuitos y universalmente aplicables.

Protocolos deben permitir, cuando sea necesario, un proceso de autentificación y autorización.

Metadatos han de ser accesibles, aunque los datos ya no estén disponibles.

Datos y metadatos deben utilizar lenguajes formales, accesibles, normalizados.

Datos y metadatos deben utilizar vocabularios (esquemas, ontologías, etc.) que sigan los principios FAIR.

Incluir referencias cruzadas y enlaces entre datos y metadatos.

Datos y metadatos han de estar descritos con una pluralidad de atributos precisos y relevantes.

Datos y metadatos deben publicarse con una licencia de uso y reutilización clara y accesible.

Datos y metadatos tienen que tener asociada información sobre

procedencia (provenance) para asociar metadatos a los datos durante su ciclo de vida.

Datos y metadatos han de cumplir los estándares comunes al área de conocimiento.

(21)

F indable = Fáciles de encontrar

Los datos deben de ser fáciles de localizar/encontrar.

I nteroperable

A ccessible = accesible

R

Una vez encontrados, debemos poder acceder a

ellos.

Ha de ser posible interpretarlos y trabajar con

ellos.

Puedan ser reutilizados.

Datos y metadatos han de tener identificador único y persistente (DOI).

Datos descritos con metadatos enriquecidos.

Deben existir metadatos específicos para el identificador persistente.

Datos y metadatos han de estar registrados o indexados en sistemas con motor de búsqueda.

Datos y metadatos pueden ser recuperables con su identificador mediante protocolos estandarizados.

Protocolos abiertos, gratuitos y universalmente aplicables.

Protocolos deben permitir, cuando sea necesario, un proceso de autentificación y autorización.

Metadatos han de ser accesibles, aunque los datos ya no estén disponibles.

Datos y metadatos deben utilizar lenguajes formales, accesibles, normalizados.

Datos y metadatos deben utilizar vocabularios (esquemas, ontologías, etc.) que sigan los principios FAIR.

Incluir referencias cruzadas y enlaces entre datos y metadatos.

Datos y metadatos han de estar descritos con una pluralidad de atributos precisos y relevantes.

Datos y metadatos deben publicarse con una licencia de uso y reutilización clara y accesible.

Datos y metadatos tienen que tener asociada información sobre

procedencia (provenance) para asociar metadatos a los datos durante su

(22)

https://fairaware.dans.knaw.nl/

https://ardc.edu.au/resources/ab outdata/fair-data/fair-self-assess ment-tool/

https://doi.org/10.5281/zenodo.1065990

https://zenodo.org/record/5111307/files/Son%20sus%20dat

os%20FAIR.docx

(23)

http://www.consorciomadrono.es/wp-content/upl oads/2018/10/INFOGRAFIA_castellano_2018_04_p

arte_02.pdf

El Consorcio Madroño te ayuda a que tus

datos sean FAIR

(24)

https://static1.squarespace.com/static/5d3799de845604000199cd24/t/5f0621e031811d08f9c4cd27/1594237427481/Principios+CREA.pdf

(25)

Etiquetas

informativas para datos gestionados

según Principios CREA

https://localcontexts.org/labels/traditional-knowledge-labels/

(26)

3. Políticas

(27)

https://www.horizonteeuropa.es/

https://eosc-portal.eu/

Programa marco de investigación e innovación de la Unión Europea para el período 2021-2017.

Mandato: datos abiertos.

Unión Europea

Iniciativa europea que tiene como objetivo desarrollar una

infraestructura que brinde a sus usuarios servicios que promuevan prácticas científicas abiertas. Su finalidad es proporcionar a los investigadores, innovadores, empresas y ciudadanos europeos un entorno multidisciplinario abierto donde puedan publicar, encontrar y reutilizar datos, herramientas y servicios para la investigación y la

innovación.

(28)

España. Ley 17/2022, de 5 de septiembre, por la que se modifica la Ley 14/2011, de 1 de junio, de la Ciencia, la

Tecnología y la Innovación

Artículo 37. Ciencia abierta.

1. Los agentes públicos del Sistema Español de Ciencia, Tecnología e Innovación

impulsarán que se haga difusión de los resultados de la actividad científica, tecnológica y de innovación, y que los resultados de la investigación, incluidas las publicaciones

científicas, datos, códigos y metodologías, estén disponibles en acceso abierto. El acceso gratuito y libre a los resultados se fomentará mediante el desarrollo de repositorios

institucionales o temáticos de acceso abierto, propios o compartidos.

2. El personal de investigación del sector público o cuya actividad investigadora esté financiada mayoritariamente con fondos públicos y que opte por diseminar sus resultados de investigación en publicaciones científicas, deberá depositar una copia de la versión final aceptada para publicación y los datos asociados a las mismas en repositorios

institucionales o temáticos de acceso abierto, de forma simultánea a la fecha de publicación.

https://www.boe.es/diario_boe/txt.php?id=BOE-A-2022-14581

(29)

POLÍTICAS Y OBLIGACIONES EN EL CONTEXTO DE LATINOAMÉRICA

LA Referencia - Politicas para la Ciencia Abierta y los Datos Cientificos en America Latina

Legislaciones nacionales: Perú, Argentina y México Chile: CONICYT

Brasil: Manifiesto para datos abiertos desde el IBICT

https://www.re3data.org/browse/by-country/

INTEGRACIÓN DE LA REFERENCIA CON REDES GLOBALES: COAR y OpenAIRE

ACUERDO CON RDA PARA CAPACITACIONES SOBRE GESTIÓN DE DATOS DE INVESTIGACIÓN:

https://www.youtube.com/user/RepositoriosLA

(30)

1.- Leer detenidamente los requerimientos del

patrocinador o política institucional sobre los datos de investigación.

2.- Aunque no haya requerimientos del patrocinador o institución SIEMPRE es aconsejable gestionar

adecuadamente los datos de investigación.

(31)

4. Ciclo de vida de los datos de

investigación

(32)

http://hdl.handle.net/20.500.11967/69

(33)

LA GESTIÓN DE DATOS DE INVESTIGACIÓN (GDI) DURANTE EL PROYECTO

(34)

F UENTE: Andrews, Heather. Gestión de Datos de Investigación (Parte I y II): https://youtu.be/BM-lZ2XCCN0

(35)

ASPECTOS ÉTICOS Y DATOS PERSONALES

Datos “sensibles” que no deberían compartirse:

● Datos constituyen o contienen información sensible,por ejemplo, datos personales,

confidenciales en relación a asuntos de seguridad…

● Cuando los datos no son propiedad de quienes los han recopilado (solicitar autorización expresa)

● Cuando los datos tienen un valor financiero asociado a su propiedad intelectual (pendientes de patente, por ejemplo) o que van a ser comercializados

Fuente: Guía de Datos de Investigación UHU: https://guiasbuh.uhu.es/datosinvestigacion Consulte al Comité

de Ética de su institución

https://www.uc3

m.es/investigacion

-apoyopdi/cei

(36)

Procesar los datos personales de forma que se prevenga de manera irreversible la identificación. Puede ser por razones éticas, como proteger la identidad de las personas participantes en la investigación, por razones legales, o comerciales.

Técnicas de anonimización y pseudoanonimización: Eliminación de identificadores directos (nombres, dirección, fechas personales…). Eliminación de identificadores indirectos (profesión, sexo, enfermedad, lugar de nacimiento…).

Para ello se puede: eliminar líneas de información, sustituir datos numéricos por rangos, etc.

La anonimización no solo consiste en evitar la identificación, sino también, en tratar de evitar la reidentificación, es decir, poder identificar los datos de un individuo dentro del dataset partiendo de un subconjunto de datos conocidos.

Buenas prácticas: anonimización

https://amnesia.openaire.eu/

Información proporcionada por la AEPD:

https://www.aepd.es/sites/default/files/2019-09/guia-orientaciones-procedimientos-anonimizacion.pdf

(37)

F UENTE: Andrews, Heather. Gestión de Datos de Investigación (Parte I y II):

https://youtu.be/BM-lZ2XCCN0

(38)

ALMACENAMIENTO-RECOMENDACIÓN

(39)

5. Preparar un Plan de Gestión de Datos

(DMP / PGD)

(40)

Plan de Gestión de datos / Data Management Plan:

Documento formal que debe presentarse al inicio de la investigación y modificarse según se avanza con el proyecto, por lo tanto, es un documento vivo.

Existen varias plataformas de apoyo para cumplimentarlo, todas basadas en un cuestionario donde explicar la gestión durante el ciclo de vida de los datos, desde su creación hasta la finalización del proyecto de investigación.

El PGD describe en detalle aspectos sobre la recolección o creación, organización, documentación, compartición y preservación de los datos.

Ventaja: es una buena práctica de gran ayuda para planificar la investigación con datos.

http://pgd.consorciomadrono.es/

Plan de Gestión de Datos - definición:

https://argos.open aire.eu/splash

- PARTHENOS: plantilla para datasets de arqueología

- Horizonte Europa. Plantilla para D MP

- Digital Curation Centre. Checklist for a Data Management Plan. v.4.0. Edinburgh:

http://www.dcc.ac.uk/sites/default/files/documents/data-forum/documents/docs/

DCC_Checklist_DMP_v3.pdf

(41)

https://argos.openaire.eu/home

(42)

http://hdl.handle.net/20.500.11967/71

(43)

DMP/PGD EN HORIZON 2020

TEMPLATE HORIZON 2020 DATA MANAGEMENT PLAN (DMP)

SECCIÓN PGD Aspectos a considerar

1. Sumario

Propósito de recolección de los datos/creación; relación con los objetivos del proyecto; tipos y formatos de los datos; especificar si se están reutilizando datos;

indicar el origen de los datos; tamaño estimado de los datos (si se sabe); utilidad de los datos (para quién serán útiles).

2. Datos FAIR

2.1 Datos “localizables” (provisión de los metadatos)

Describir la provisión de los metadatos; describir la identificabilidad de los datos y estándares: ¿usará sistemas de identificación únicos y persistentes como el DOI?;

describir el sistema utilizado para nombrar los ficheros; describir la búsqueda por palabras clave; describir el sistema para identificar las versiones; especificar el estándar para la creación de metadatos (si existe en su disciplina). Si no existe, describir qué tipo de metadatos se crearán y cómo.

2.2 Datos accesibles en abierto Especificar qué datos serán abiertos, si algún dato se mantiene cerrado proporcionar justificación; especificar cómo los datos estarán disponibles; especificar qué métodos o software será necesario para acceder a los datos; estará la documentación sobre el software requerido para acceder a los datos en abierto; es posible incluir el software relevante (por ejemplo, código fuente); dónde se van a depositar los datos, metadatos, documentación y código; especificar el tipo de acceso en el caso de que haya restricciones.

2.3 Datos interoperables Valorar la interoperabilidad de los datos. Especificar qué vocabularios, estándares o metodologías de datos y metadatos se utilizarán para facilitar la interoperabilidad.

Especifique si va a utilizar un vocabulario estándar para todos los tipos de datos presentes en su dataset. Si no, proporcionará un mapeo a las ontologías más

(44)

DMP/PGD EN HORIZON 2020

SECCIÓN PGD Aspectos a considerar

2.4 Reutilización de los datos (a través de licencias de uso)

Especificar qué tipo de licencias se utilizarán para permitir el uso más amplio posible. Especificar cuándo estarán disponibles los datos para su reutilización y si tendrán algún tipo de embargo.

Especificar si algunos de los datos serán de acceso restringido y porqué.

Especificar los procesos para asegurar la calidad de los datos.

Especificar el período de tiempo durante el que estarán los datos disponibles.

3

.

Asignación de recursos

Estimar los costes de hacer sus datos FAIR. Describir cómo se van a cubrir.

Identificar claramente la responsabilidad para la gestión de los datos en su proyecto.

Describir los costes de la preservación a largo plazo.

4. Seguridad de los datos

Aborda la recuperación de datos, así como el almacenamiento y la transferencia segura de datos confidenciales

5. Aspectos éticos

Indicar si hay algún problema ético en el uso de los datos (datos personales, etc.)

6. Otros

Indicar otros procedimientos nacionales, sectoriales o departamentales para la gestión de datos que se estén utilizando (si los hubiera).

HISTORIA DE LOS CAMBIOS

Versión Fecha de publicación Cambio 1.0 13.10.2016 Versión inicial

(45)

6. Buenas prácticas sobre el tratamiento de ficheros a

depositar: nombres, formatos, protección de datos personales,

etc.

(46)

Buenas prácticas: convenciones de nomenclatura de ficheros

datos_miproyecto_version_casi_final.xxx

datos_miproyecto_version_casi_final_para_revisar_enero.xxx

datos_miproyecto_version_casi_final_para_revisar_enero_final.xxx

datos_miproyecto_version_casi_final_para_revisar_enero_final_para pasar a compañero.xxx datos_miproyecto_version_casi_final_para_revisar_enero_final_para pasar a

compañero_estasíquesí!!!!!!!.xxx

Deben ser:

- significativos / descriptivos - consistentes

Podrían incluir:

- Nombre o acrónimo del proyecto o experimento - Ubicación/coordenadas espaciales

- Nombre/iniciales del investigador

- Fecha o rango de fechas del experimento - Tipo de datos

- Condiciones

- Número de versión del archivo - etc.

Hay que tener en cuenta que la colocación de los

elementos puede influir en la ordenación de los

ficheros.

X

(47)

Recomendaciones:

- Decide una convención para los nombres de ficheros al comienzo del proyecto. Han de ser expansibles (scalable).

- Evita nombres largos de ficheros (y estructuras complejas de carpetas).

- Usa guion bajo (_) como delimitador de los diferentes elementos.

- Usa guion medio (-) para separar palabras dentro de un mismo elemento.

- No usar tildes, signos ( ~ ! @ # $ % ^ & *...), ñ, no usar espacios, etc.

- Pon correctamente la extensión del fichero y que empiece por un solo punto (.)

- Ordena los elementos de lo general a lo específico.

- Fechas: año,mes,día (YYYYMMDD). Tiempos: hora,minutos,segundos (HHMMSS).

- Nombres propios: comenzar por apellido.

- Control de versiones: V01, V02, etc.

Software para renombrar ficheros:

- Bulk Rename Utility

- Renamer

(48)

Buenas prácticas: formatos

- Dependerá de la disciplina y del tipo de datos.

- Mejor formatos abiertos (no propietarios).

- No comprimidos.

- No encriptados.

Fuente: University of Stanford https://guides.library.stanford.edu/data-best-practices/format-files

(49)

Buenas prácticas: datos tabulares

(50)

https://datos.gob.es/es/documentacion/guia-practica-para-la-publicacion-de-datos-tabulares-en-archivos-csv

(51)

- Datos tabulares son los datos dispuestos en tablas (en filas y columnas).

Cada observación/

registro es una fila.

Cada variable/campo es una columna.

En un diccionario de datos se puede incluir toda la información

necesaria para que la estructura del conjunto de datos sea

(52)

Recomendaciones:

- No cortar/pegar desde otros programas que “arrastren” código oculto o formato (por ejemplo Word).

- Formatear las celdas como texto antes de introducir los datos o seleccionar

“texto” durante la importación.

- La estética (formato, colores, etc.) NO es lo importante e incluso puede

perderse al migrar a otros formatos o al abrirlo con programas diferentes.

(53)

- No usar colores/tramas/formatos con significado, ya que se pueden perder.

- Evitar columnas y filas vacías.

- Evitar celdas vacías.

Eliminar las filas y/o columnas vacías.

En las celdas vacías es mejor poner algún valor (por ejemplo, 0).

X

X

(54)

- Evitar varias filas de encabezados.

- Evitar las celdas combinadas.

Mejor: X

(55)

- Evitar caracteres y símbolos especiales ya que pueden ser ilegibles para otros programas y pueden ser modificados cuando se exporten los datos.

- Evitar las comas porque pueden ser malinterpretadas al exportar a .csv (por ejemplo, usar dos puntos, punto y coma, guion).

- Evitar comentarios incrustados (se pueden incluir en una nueva columna).

Mejor: X

(56)

- Los gráficos no han de ir en la misma hoja de la tabla.

También se pueden crear como ficheros de imagen y subirlos al repositorio.

X

(57)

7. Reutilizar y compartir:

licencias de uso

(58)

Reutilizar y compartir: licencias de uso

(59)

Reutilizar y compartir: licencias de uso

(60)

Reutilizar y compartir: licencias de uso

https://creativecommons.org/licenses/?lang=es_ES

https://opendatacommons.org/

PARA LICENCIAR SOFTWARE:

MIT License Apache License

GNU General Public License

License Selector: https://ufal.github.io/public-license-selector/

Juego para practicar:

https://plato.algonquincollege.com/ac-Library/OER/license-matching-activity/story_html5.html

(61)

Fuente: Marisa Pérez (UAM) Introduction to Open Science, Open Access and Open Data. UC3M, 14/11/2017

Reutilizar y compartir: licencias de uso

https://opendatacommons.org/

● Open Data Commons Public Domain Dedication and License

(PDDL)

(62)

Reutilizar y compartir: licencias de uso Creative Commons

(63)

Reutilizar y compartir: licencias de uso Creative Commons

(64)

8. Difusión de datos finales

(65)

"As open as possible, as closed as necessary"

“Tan abiertos como sea posible,

tan cerrados como sea necesario”

(66)

- Data journals

- Como información

suplementaria junto al artículo de revista

- Repositorios

(institucionales, de datos, etc.)

Comprobar posibles requerimientos

(financiadores,

revista, etc.).

(67)

Repositorios para el depósito de los datos finales:

re3Data - Registry of Research Data Repositories:

https://www.re3data.org/search

Atención: los repositorios (de datos)

institucionales generalmente solo permiten el depósito a

miembros de la institución.

https://zenodo.org/

- Repositorio más habitual en la disciplina.

- Repositorios multidisciplinares. Por ejemplo:

https://commons.datacite.org/repositories?query=

https://www.coretrustseal.org/why-certification/certified-repositories/

(68)

La importancia de los repositorios en la preservación

Plan de preservación de e-cienciaDatos:

http://www.consorciomadrono.es/docs/PlanDePreservacion.pdf

(69)

Buenas prácticas: citas http://hdl.handle.net/20.500.11967/72

(70)

https://citation.crosscite.org/

http://uc3m.libguides.com/guias_tematicas/citas_bibliograficas - APA

Citar datos: recursos

Los repositorios suelen incluir

herramientas para elaborar las citas.

(71)

9. Ejemplos de uso:

Consorcio Madroño

(72)

http://www.consorciomadrono.es/investigam/

Plan de Gestión de Datos

Para cualquier investigad@r

(73)

Abierto a cualquier investigad@r

http://www.consorciomadrono.es/in vestigam/pagoda/

PR ÓXIMAMENTE: AR GOS

(74)

Repositorio para el depósito de los datos finales: e-cienciaDatos

https://edatos.consorciomadrono.es/

Guía ¿Cómo depositar sus datos?

http://www.consorciomadrono.es/wp-content/up loads/2019/07/guia_gestion_datos_investigacion

_2019-04-05.pub_.pdf

Para personal investigador de las universidades que forman parte

del Consorcio Madroño .

(75)

Grupo Técnico Iberoamericano de Dataverse

Instituto Brasileiro de Informação em Ciência e Tecnologia Consorcio Madroño

Consorcio de Servicios Universitarios de Cataluña Universidade de Aveiro

Universidad Católica del Perú Universidad de Chile

Universidad Nacional del Rosario (Argentina)

Universidad del Rosario (Colombia)

(76)

¿Qué datos se pueden depositar?

Conjuntos de datos de cualquier disciplina del personal docente e investigador de

las universidades del Consorcio Madroño. Datos finales o datos completos,

preparados para su distribución pública y su reutilización. Deberán contener la

pertinente documentación anexa (readme.txt).

(77)

¿Qué es una plantilla “readme.txt”?

Es una plantilla para generar un documento donde se proporciona información sobre los datos para que sean comprensibles y reutilizables: autoría, título, descripción, metodología, proyectos financiadores, cobertura temporal y geográfica, derechos de uso y privacidad, etc.

Los gestores del repositorio e-cienciaDatos utilizarán la información proporcionada en la plantilla readme.txt para:

● cumplimentar los metadatos estandarizados que describen el dataset y que son recolectados por diversos servidores científicos.

● elaborar un fichero readme.txt que se incluirá junto al resto de ficheros del dataset.

https://edatos.consorciomadrono.es/readme.xhtml

(78)

readme.txt

DOI

https://doi.org/10.21950/1YOPT9

(79)
(80)

GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M Depósito de datos en e-cienciaDatos

1.- Cumplir requisitos de publicaciones periódicas que exigen tener depositados en un repositorio los datos que validen los resultados de investigación de un artículo que se vaya a publicar.

- Inmediata asignación de DOI para incluirlo en el artículo.

- Una vez aceptado y publicado el paper, lo depositamos en e- Archivo (repositorio institucional) en acceso abierto (comprobar

política editorial).

- Completar información sobre la publicación en los metadatos e-

cienciaDatos.

(81)

GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M

Depósito de datos en e-cienciaDatos

(82)

GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M Depósito de datos en e-cienciaDatos

2.- Cumplir requisitos de instituciones financiadoras.

FAIR

(83)

GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M Depósito de datos en e-cienciaDatos

3.- Grupo de investigación - Crear Dataverse

- Persona de contacto

- Procedimiento establecido

- Depósito de publicaciones en e-Archivo

Ejemplo: Grupo de investigación Nonlinear Solid Mechanics

https://edatos.consorciomadrono.es/dataverse/nonlinear_solid_mechanics

(84)

GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M Depósito de datos en e-cienciaDatos

4.- Proyecto de investigación - Crear Dataverse

- Persona de contacto

- Procedimiento establecido

- Depósito publicaciones en e-Archivo - Web institucional

Ejemplo: Proyecto EMPATÍA-CM

https://edatos.consorciomadrono.es/dataverse/empatia

(85)

GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M

Depósito de datos en e-cienciaDatos 5.- Humanidades Digitales

1ª opción:

- datasets en e-cienciaDatos

Ejemplo:

Federico-Tena World Trade Historical Database www.uc3m.es/tradehist_db

http://hdl.handle.net/10016/27666

(86)

GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M

Depósito de datos en e-cienciaDatos 5.- Humanidades Digitales

2ª opción:

- otras plataformas: Omeka S, MySQL

- dataset anexos/finales en e-cienciaDatos Ejemplo:

Diccionario Biográfico de

Colegiales Mayores Españoles

www.uc3m.es/colegiales

https://doi.org/10.21950/1YOPT9

(87)

GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M

Depósito de datos en e-cienciaDatos

6.- Datos de capítulos de monografías o monografías

Historia del Derecho

http://hdl.handle.net/10016/14846

Historia de las Universidades

http://hdl.handle.net/10016/3385

https://directory.doabooks.org/browse?type=publisher&value=Universidad+Carlos+III+de+Madrid.+Figuerola+Institute+of+Social +Science+History

http://hdl.handle.net/10016/34610

(88)

GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M Depósito de datos en e-cienciaDatos

Handle e-Archivo

(89)

GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M Depósito de datos en e-cienciaDatos

Metadato:

dc.relation.dataset

(90)

10. Material de apoyo

(91)

Material de apoyo:

- CEPAL. Gestión de datos de investigación: https://biblioguias.cepal.org/gestion-de-datos-de-investigacion - CODATA. Research Data Management Terminology:

https://codata.org/initiatives/data-science-and-stewardship/rdm-terminology-wg/rdm-terminology - Digital Curation Centre. Checklist for a Data Management Plan. v.4.0. Edinburgh:

http://www.dcc.ac.uk/sites/default/files/documents/data-forum/documents/docs/DCC_Checklist_DMP_v3.pdf - InvestigaM: Portal de Ciencia Abierta del Consorcio Madroño:

http://www.consorciomadrono.es/investigam/

- LA Referencia - Politicas para la Ciencia Abierta y los Datos Cientificos en America Latina (2018):

https://www.lareferencia.info/es/recursos/ciencia-abierta-documentos-externos/77-la-referencia-politicas-para-l a-ciencia-abierta-y-los-datos-cientificos-en-america-latina-es

- Maredata. Recomendaciones para la gestión de datos de investigación: http://hdl.handle.net/10261/173801 - MIT. Data Management. Workshops: https://libraries.mit.edu/data-management/services/workshops/

- REBIUN. Infografías sobre datos de investigación:

https://www.uc3m.es/biblioteca/publicacion-difusion-cientifica/datos-investigacion/clave-gestion - Science Europe. Research Data Management:

https://scienceeurope.org/our-priorities/research-data/research-data-management/

- Universidad Carlos III de Madrid. Servicio de Biblioteca. Datos de investigación:

(92)

Rebeca Marín: [email protected] Eva Ortiz: [email protected]

¡Gracias!

Imagen: https://pixabay.com/images/id-2502935/

Referencias

Documento similar

Estos planes de recolo- cación deben garantizar a las personas despedi- das un servicio continuado durante un periodo mínimo de seis meses que incluya medidas de formación

Cada vez son más las administraciones que se apoyan en los datos para optimizar sus procesos y servicios, para impulsar la innovación dentro y fuera de la administración y

Asegurar una calidad mínima en los datos es una de las tareas más difíciles de conseguir para los organismos públicos cuyo objetivo es publicar datos lo más rápidamente posible

- Reutilizar el código de alguna de las extensiones y mejoras realizadas por otras iniciativas previas de datos abiertos en nuestro país para mejorar la compatibilidad con la NTI

Sin embargo, consideramos que se requiere de una reflexión sobre lo que implica verificación y reproductibilidad en la investigación cualitativa, es decir, sobre los criterios

La Comisión Europea pone en marcha una iniciativa piloto de datos de investigación denominada “Open Research Data Pilot in H2020” (ORD Pilot) para depositar los datos en abierto en

Una gestión de datos efectiva tiene lugar a lo largo de todas las fases del ciclo de vida de la investigación, desde planificar el proyecto, la recogida de datos, preparar,

“El Plan de Gestión de Datos es un documento formal que describe los datos producidos en el curso de un proyecto de investigación, tanto en la fase activa, como después de que