Rebeca Marín
https://orcid.org/0000-0002-0010-1544Eva Ortiz Uceta
https://orcid.org/0000-0002-3630-6373Costa Rica
28 septiembre 2022
¿Qué es la gestión de datos y cómo la
relaciono con mi proyecto de
investigación?
1. Presentación.
2. ¿Qué son los datos de investigación?
3. Políticas.
4. Ciclo de vida de los datos de investigación.
5. Preparar un Plan de Gestión de Datos.
6. Buenas prácticas sobre el tratamiento de ficheros a depositar: nombres, formatos, protección de datos personales.
7. Reutilizar y compartir: licencias de uso.
8. Difusión de datos finales.
9. Ejemplos de uso: Consorcio Madroño
10. Material de apoyo.
Contenidos:
1. Presentación
http://hdl.handle.net/10016/27182
El Consorcio de Universidades de la Comunidad de Madrid y la UNED para la
Cooperación Bibliotecaria (Madroño) tiene como objetivo fundamental incrementar la
producción científica de sus universidades, mejorando la calidad de los servicios
bibliotecarios y promoviendo planes de cooperación entre sus miembros.
2. ¿Qué son los datos de
investigación?
@hacklib
● Son datos:
encuestas, muestreos, imágenes, vídeos, secuencias genéticas, cromatogramas, modelos climáticos, diseños, bases de datos, modelos en 3D, piezas arqueológicas, testimonios orales,...
Es decir, aquellos materiales generados o recolectados durante el transcurso de la realización de una investigación. Son la base de la evidencia científica sobre la que los investigadores construyen su trabajo.
● Dataset es un conjunto de datos.
Todos los datos de la secuencia generados por el Proyecto Genoma Humano han sido depositados rápidamente en las bases de datos públicos y puestos libremente a disposición de los científicos en el mundo, sin restricciones en cuanto a su uso o redistribución.[...]
“Desde el comienzo, uno de los principios operativos del Proyecto Genoma Humano ha sido que los datos y los recursos que ha generado son puestos rápidamente a disposición de toda la comunidad científica,"
expresó el Dr. Robert Waterston, de la Universidad de Washington, Seattle. "No sólo la inmediata liberación de los datos promueve los mejores intereses de la ciencia, también lleva al máximo los beneficios que el público recibe de dicha investigación”.
https://www.genome.gov/11510908/consorcio-internacional-completa-el-proyecto-genoma-humano
PRINCIPIOS DE BERMUDAS
Imagen: https://pixabay.com/es/illustrations/microbiolog%C3%ADa-adn-personas-163521/
Genoma
Humano
Datos de investigación en abierto Open Research Data
Da ta sharing
Fuente: http://hdl.handle.net/10016/29545
Recomendación de la UNESCO sobre la Ciencia Abierta (2021). https://unesdoc.unesco.org/ark:/48223/pf0000379949_spa
¿Por qué son importantes los datos de investigación en abierto?
- Verifican los resultados de investigación.
- Permiten su reutilización (también por los autores).
- Ahorro de costes al evitar duplicar los esfuerzos.
- Aumenta la credibilidad de la ciencia, pues hace patente la inversión pública en investigación.
- Cumplen los requerimientos de los financiadores (dinero público).
- Mejora de la transparencia.
- Aumenta la visibilidad y el impacto de la investigación.
- Potencial como acelerador de la investigación. Permite la prueba de métodos nuevos o alternativos.
- Permiten actuar de forma más rápida y eficiente en situaciones como epidemias: COVID-19
- Favorecen establecer nuevos contactos entre colegas, impulsando la colaboración.
- Preservación.
- Etc.
¿Reticencias por parte del personal investigador?
- Falta de tiempo.
- Prioridad de publicar artículos, etc.
- Falta de infraestructuras, personal experto.
- Cláusulas de confidencialidad.
- etc.
Reproducibilidad
- Reproducción: recreación de un estudio utilizando el entorno, los datos y la metodología originales.
- Replicación: recreación más general, utilizando el mismo método de análisis pero con diferentes conjuntos de datos.
- Reutilización: volver a utilizar los datos de forma más flexible más allá del contexto de la investigación original.
Méndez, E., Bautista-Puig, N. (2022). Open Science: Observations for Universities as Agents of Paradigm Change. New Visions for Higher Education towards 2030 - Part 2: Transitions:
Key Topics, Key Voices. https://www.guni-call4action.org/sites/default/files/2022-05/Eva%20Me%7Fndez%20and%20Nu%7Fria%20Bautista-Puig%20.pdf
https://mobile.twitter.com/JaimeObregon/status/1434926939878264832
Reproducción (mismos datos, mismo método):
Replicación (distintos datos, mismo método):
Reutilización:
Transpar encia,
rig or
Fiabilidad
Sos tenibilidad, equidad, e
tc.
Datos abiertos de investigación
FAIR
El orden de las siglas responde a una secuencia lógica.
4 principios establecidos por Force11.
Establecen cómo deben ser los datos para ser compartidos.
F indable = Fáciles de encontrar
Los datos deben de ser fáciles de localizar/encontrar.
I nteroperable
A ccessible = accesible
R eusable = reutilizable
Una vez encontrados, debemos poder acceder a
ellos.
Ha de ser posible interpretarlos y trabajar con
ellos.
Puedan ser reutilizados.
● Datos y metadatos han de tener identificador único y persistente (DOI).
● Datos descritos con metadatos enriquecidos.
● Deben existir metadatos específicos para el identificador persistente.
● Datos y metadatos han de estar registrados o indexados en sistemas con motor de búsqueda.
● Datos y metadatos pueden ser recuperables con su identificador mediante protocolos estandarizados.
● Protocolos abiertos, gratuitos y universalmente aplicables.
● Protocolos deben permitir, cuando sea necesario, un proceso de autentificación y autorización.
● Metadatos han de ser accesibles, aunque los datos ya no estén disponibles.
● Datos y metadatos deben utilizar lenguajes formales, accesibles, normalizados.
● Datos y metadatos deben utilizar vocabularios (esquemas, ontologías, etc.) que sigan los principios FAIR.
● Incluir referencias cruzadas y enlaces entre datos y metadatos.
● Datos y metadatos han de estar descritos con una pluralidad de atributos precisos y relevantes.
● Datos y metadatos deben publicarse con una licencia de uso y reutilización clara y accesible.
● Datos y metadatos tienen que tener asociada información sobre
procedencia (provenance) para asociar metadatos a los datos durante su ciclo de vida.
● Datos y metadatos han de cumplir los estándares comunes al área de conocimiento.
F indable = Fáciles de encontrar
Los datos deben de ser fáciles de localizar/encontrar.
I nteroperable
A ccessible = accesible
R
Una vez encontrados, debemos poder acceder a
ellos.
Ha de ser posible interpretarlos y trabajar con
ellos.
Puedan ser reutilizados.
● Datos y metadatos han de tener identificador único y persistente (DOI).
● Datos descritos con metadatos enriquecidos.
● Deben existir metadatos específicos para el identificador persistente.
● Datos y metadatos han de estar registrados o indexados en sistemas con motor de búsqueda.
● Datos y metadatos pueden ser recuperables con su identificador mediante protocolos estandarizados.
● Protocolos abiertos, gratuitos y universalmente aplicables.
● Protocolos deben permitir, cuando sea necesario, un proceso de autentificación y autorización.
● Metadatos han de ser accesibles, aunque los datos ya no estén disponibles.
● Datos y metadatos deben utilizar lenguajes formales, accesibles, normalizados.
● Datos y metadatos deben utilizar vocabularios (esquemas, ontologías, etc.) que sigan los principios FAIR.
● Incluir referencias cruzadas y enlaces entre datos y metadatos.
● Datos y metadatos han de estar descritos con una pluralidad de atributos precisos y relevantes.
● Datos y metadatos deben publicarse con una licencia de uso y reutilización clara y accesible.
● Datos y metadatos tienen que tener asociada información sobre
procedencia (provenance) para asociar metadatos a los datos durante su
https://fairaware.dans.knaw.nl/
https://ardc.edu.au/resources/ab outdata/fair-data/fair-self-assess ment-tool/
https://doi.org/10.5281/zenodo.1065990
https://zenodo.org/record/5111307/files/Son%20sus%20dat
os%20FAIR.docx
http://www.consorciomadrono.es/wp-content/upl oads/2018/10/INFOGRAFIA_castellano_2018_04_p
arte_02.pdf
El Consorcio Madroño te ayuda a que tus
datos sean FAIR
https://static1.squarespace.com/static/5d3799de845604000199cd24/t/5f0621e031811d08f9c4cd27/1594237427481/Principios+CREA.pdf
Etiquetas
informativas para datos gestionados
según Principios CREA
https://localcontexts.org/labels/traditional-knowledge-labels/
3. Políticas
https://www.horizonteeuropa.es/
https://eosc-portal.eu/
Programa marco de investigación e innovación de la Unión Europea para el período 2021-2017.
Mandato: datos abiertos.
Unión Europea
Iniciativa europea que tiene como objetivo desarrollar una
infraestructura que brinde a sus usuarios servicios que promuevan prácticas científicas abiertas. Su finalidad es proporcionar a los investigadores, innovadores, empresas y ciudadanos europeos un entorno multidisciplinario abierto donde puedan publicar, encontrar y reutilizar datos, herramientas y servicios para la investigación y la
innovación.
España. Ley 17/2022, de 5 de septiembre, por la que se modifica la Ley 14/2011, de 1 de junio, de la Ciencia, la
Tecnología y la Innovación
Artículo 37. Ciencia abierta.
1. Los agentes públicos del Sistema Español de Ciencia, Tecnología e Innovación
impulsarán que se haga difusión de los resultados de la actividad científica, tecnológica y de innovación, y que los resultados de la investigación, incluidas las publicaciones
científicas, datos, códigos y metodologías, estén disponibles en acceso abierto. El acceso gratuito y libre a los resultados se fomentará mediante el desarrollo de repositorios
institucionales o temáticos de acceso abierto, propios o compartidos.
2. El personal de investigación del sector público o cuya actividad investigadora esté financiada mayoritariamente con fondos públicos y que opte por diseminar sus resultados de investigación en publicaciones científicas, deberá depositar una copia de la versión final aceptada para publicación y los datos asociados a las mismas en repositorios
institucionales o temáticos de acceso abierto, de forma simultánea a la fecha de publicación.
https://www.boe.es/diario_boe/txt.php?id=BOE-A-2022-14581
POLÍTICAS Y OBLIGACIONES EN EL CONTEXTO DE LATINOAMÉRICA
LA Referencia - Politicas para la Ciencia Abierta y los Datos Cientificos en America Latina
Legislaciones nacionales: Perú, Argentina y México Chile: CONICYT
Brasil: Manifiesto para datos abiertos desde el IBICT
https://www.re3data.org/browse/by-country/
INTEGRACIÓN DE LA REFERENCIA CON REDES GLOBALES: COAR y OpenAIRE
ACUERDO CON RDA PARA CAPACITACIONES SOBRE GESTIÓN DE DATOS DE INVESTIGACIÓN:
https://www.youtube.com/user/RepositoriosLA
1.- Leer detenidamente los requerimientos del
patrocinador o política institucional sobre los datos de investigación.
2.- Aunque no haya requerimientos del patrocinador o institución SIEMPRE es aconsejable gestionar
adecuadamente los datos de investigación.
4. Ciclo de vida de los datos de
investigación
http://hdl.handle.net/20.500.11967/69
LA GESTIÓN DE DATOS DE INVESTIGACIÓN (GDI) DURANTE EL PROYECTO
F UENTE: Andrews, Heather. Gestión de Datos de Investigación (Parte I y II): https://youtu.be/BM-lZ2XCCN0
ASPECTOS ÉTICOS Y DATOS PERSONALES
Datos “sensibles” que no deberían compartirse:
● Datos constituyen o contienen información sensible,por ejemplo, datos personales,
confidenciales en relación a asuntos de seguridad…
● Cuando los datos no son propiedad de quienes los han recopilado (solicitar autorización expresa)
● Cuando los datos tienen un valor financiero asociado a su propiedad intelectual (pendientes de patente, por ejemplo) o que van a ser comercializados
Fuente: Guía de Datos de Investigación UHU: https://guiasbuh.uhu.es/datosinvestigacion Consulte al Comité
de Ética de su institución
https://www.uc3
m.es/investigacion
-apoyopdi/cei
Procesar los datos personales de forma que se prevenga de manera irreversible la identificación. Puede ser por razones éticas, como proteger la identidad de las personas participantes en la investigación, por razones legales, o comerciales.
Técnicas de anonimización y pseudoanonimización: Eliminación de identificadores directos (nombres, dirección, fechas personales…). Eliminación de identificadores indirectos (profesión, sexo, enfermedad, lugar de nacimiento…).
Para ello se puede: eliminar líneas de información, sustituir datos numéricos por rangos, etc.
La anonimización no solo consiste en evitar la identificación, sino también, en tratar de evitar la reidentificación, es decir, poder identificar los datos de un individuo dentro del dataset partiendo de un subconjunto de datos conocidos.
Buenas prácticas: anonimización
https://amnesia.openaire.eu/
Información proporcionada por la AEPD:
https://www.aepd.es/sites/default/files/2019-09/guia-orientaciones-procedimientos-anonimizacion.pdf
F UENTE: Andrews, Heather. Gestión de Datos de Investigación (Parte I y II):
https://youtu.be/BM-lZ2XCCN0
ALMACENAMIENTO-RECOMENDACIÓN
5. Preparar un Plan de Gestión de Datos
(DMP / PGD)
Plan de Gestión de datos / Data Management Plan:
Documento formal que debe presentarse al inicio de la investigación y modificarse según se avanza con el proyecto, por lo tanto, es un documento vivo.
Existen varias plataformas de apoyo para cumplimentarlo, todas basadas en un cuestionario donde explicar la gestión durante el ciclo de vida de los datos, desde su creación hasta la finalización del proyecto de investigación.
El PGD describe en detalle aspectos sobre la recolección o creación, organización, documentación, compartición y preservación de los datos.
Ventaja: es una buena práctica de gran ayuda para planificar la investigación con datos.
http://pgd.consorciomadrono.es/
Plan de Gestión de Datos - definición:
https://argos.open aire.eu/splash
- PARTHENOS: plantilla para datasets de arqueología
- Horizonte Europa. Plantilla para D MP
- Digital Curation Centre. Checklist for a Data Management Plan. v.4.0. Edinburgh:
http://www.dcc.ac.uk/sites/default/files/documents/data-forum/documents/docs/
DCC_Checklist_DMP_v3.pdf
https://argos.openaire.eu/home
http://hdl.handle.net/20.500.11967/71
DMP/PGD EN HORIZON 2020
TEMPLATE HORIZON 2020 DATA MANAGEMENT PLAN (DMP)
SECCIÓN PGD Aspectos a considerar
1. Sumario
Propósito de recolección de los datos/creación; relación con los objetivos del proyecto; tipos y formatos de los datos; especificar si se están reutilizando datos;indicar el origen de los datos; tamaño estimado de los datos (si se sabe); utilidad de los datos (para quién serán útiles).
2. Datos FAIR
2.1 Datos “localizables” (provisión de los metadatos)
Describir la provisión de los metadatos; describir la identificabilidad de los datos y estándares: ¿usará sistemas de identificación únicos y persistentes como el DOI?;
describir el sistema utilizado para nombrar los ficheros; describir la búsqueda por palabras clave; describir el sistema para identificar las versiones; especificar el estándar para la creación de metadatos (si existe en su disciplina). Si no existe, describir qué tipo de metadatos se crearán y cómo.
2.2 Datos accesibles en abierto Especificar qué datos serán abiertos, si algún dato se mantiene cerrado proporcionar justificación; especificar cómo los datos estarán disponibles; especificar qué métodos o software será necesario para acceder a los datos; estará la documentación sobre el software requerido para acceder a los datos en abierto; es posible incluir el software relevante (por ejemplo, código fuente); dónde se van a depositar los datos, metadatos, documentación y código; especificar el tipo de acceso en el caso de que haya restricciones.
2.3 Datos interoperables Valorar la interoperabilidad de los datos. Especificar qué vocabularios, estándares o metodologías de datos y metadatos se utilizarán para facilitar la interoperabilidad.
Especifique si va a utilizar un vocabulario estándar para todos los tipos de datos presentes en su dataset. Si no, proporcionará un mapeo a las ontologías más
DMP/PGD EN HORIZON 2020
SECCIÓN PGD Aspectos a considerar
2.4 Reutilización de los datos (a través de licencias de uso)
Especificar qué tipo de licencias se utilizarán para permitir el uso más amplio posible. Especificar cuándo estarán disponibles los datos para su reutilización y si tendrán algún tipo de embargo.
Especificar si algunos de los datos serán de acceso restringido y porqué.
Especificar los procesos para asegurar la calidad de los datos.
Especificar el período de tiempo durante el que estarán los datos disponibles.
3
.Asignación de recursos
Estimar los costes de hacer sus datos FAIR. Describir cómo se van a cubrir.Identificar claramente la responsabilidad para la gestión de los datos en su proyecto.
Describir los costes de la preservación a largo plazo.
4. Seguridad de los datos
Aborda la recuperación de datos, así como el almacenamiento y la transferencia segura de datos confidenciales5. Aspectos éticos
Indicar si hay algún problema ético en el uso de los datos (datos personales, etc.)6. Otros
Indicar otros procedimientos nacionales, sectoriales o departamentales para la gestión de datos que se estén utilizando (si los hubiera).HISTORIA DE LOS CAMBIOS
Versión Fecha de publicación Cambio 1.0 13.10.2016 Versión inicial
6. Buenas prácticas sobre el tratamiento de ficheros a
depositar: nombres, formatos, protección de datos personales,
etc.
Buenas prácticas: convenciones de nomenclatura de ficheros
datos_miproyecto_version_casi_final.xxx
datos_miproyecto_version_casi_final_para_revisar_enero.xxx
datos_miproyecto_version_casi_final_para_revisar_enero_final.xxx
datos_miproyecto_version_casi_final_para_revisar_enero_final_para pasar a compañero.xxx datos_miproyecto_version_casi_final_para_revisar_enero_final_para pasar a
compañero_estasíquesí!!!!!!!.xxx
Deben ser:
- significativos / descriptivos - consistentes
Podrían incluir:
- Nombre o acrónimo del proyecto o experimento - Ubicación/coordenadas espaciales
- Nombre/iniciales del investigador
- Fecha o rango de fechas del experimento - Tipo de datos
- Condiciones
- Número de versión del archivo - etc.
Hay que tener en cuenta que la colocación de los
elementos puede influir en la ordenación de los
ficheros.
X
Recomendaciones:
- Decide una convención para los nombres de ficheros al comienzo del proyecto. Han de ser expansibles (scalable).
- Evita nombres largos de ficheros (y estructuras complejas de carpetas).
- Usa guion bajo (_) como delimitador de los diferentes elementos.
- Usa guion medio (-) para separar palabras dentro de un mismo elemento.
- No usar tildes, signos ( ~ ! @ # $ % ^ & *...), ñ, no usar espacios, etc.
- Pon correctamente la extensión del fichero y que empiece por un solo punto (.)
- Ordena los elementos de lo general a lo específico.
- Fechas: año,mes,día (YYYYMMDD). Tiempos: hora,minutos,segundos (HHMMSS).
- Nombres propios: comenzar por apellido.
- Control de versiones: V01, V02, etc.
Software para renombrar ficheros:
- Bulk Rename Utility
- Renamer
Buenas prácticas: formatos
- Dependerá de la disciplina y del tipo de datos.
- Mejor formatos abiertos (no propietarios).
- No comprimidos.
- No encriptados.
Fuente: University of Stanford https://guides.library.stanford.edu/data-best-practices/format-files
Buenas prácticas: datos tabulares
https://datos.gob.es/es/documentacion/guia-practica-para-la-publicacion-de-datos-tabulares-en-archivos-csv
- Datos tabulares son los datos dispuestos en tablas (en filas y columnas).
Cada observación/
registro es una fila.
Cada variable/campo es una columna.
En un diccionario de datos se puede incluir toda la información
necesaria para que la estructura del conjunto de datos sea
Recomendaciones:
- No cortar/pegar desde otros programas que “arrastren” código oculto o formato (por ejemplo Word).
- Formatear las celdas como texto antes de introducir los datos o seleccionar
“texto” durante la importación.
- La estética (formato, colores, etc.) NO es lo importante e incluso puede
perderse al migrar a otros formatos o al abrirlo con programas diferentes.
- No usar colores/tramas/formatos con significado, ya que se pueden perder.
- Evitar columnas y filas vacías.
- Evitar celdas vacías.
Eliminar las filas y/o columnas vacías.
En las celdas vacías es mejor poner algún valor (por ejemplo, 0).
X
X
- Evitar varias filas de encabezados.
- Evitar las celdas combinadas.
Mejor: X
- Evitar caracteres y símbolos especiales ya que pueden ser ilegibles para otros programas y pueden ser modificados cuando se exporten los datos.
- Evitar las comas porque pueden ser malinterpretadas al exportar a .csv (por ejemplo, usar dos puntos, punto y coma, guion).
- Evitar comentarios incrustados (se pueden incluir en una nueva columna).
Mejor: X
- Los gráficos no han de ir en la misma hoja de la tabla.
También se pueden crear como ficheros de imagen y subirlos al repositorio.
X
7. Reutilizar y compartir:
licencias de uso
Reutilizar y compartir: licencias de uso
Reutilizar y compartir: licencias de uso
Reutilizar y compartir: licencias de uso
https://creativecommons.org/licenses/?lang=es_ES
https://opendatacommons.org/
PARA LICENCIAR SOFTWARE:
MIT License Apache License
GNU General Public License
License Selector: https://ufal.github.io/public-license-selector/
Juego para practicar:
https://plato.algonquincollege.com/ac-Library/OER/license-matching-activity/story_html5.html
Fuente: Marisa Pérez (UAM) Introduction to Open Science, Open Access and Open Data. UC3M, 14/11/2017
Reutilizar y compartir: licencias de uso
https://opendatacommons.org/
● Open Data Commons Public Domain Dedication and License
(PDDL)
Reutilizar y compartir: licencias de uso Creative Commons
Reutilizar y compartir: licencias de uso Creative Commons
8. Difusión de datos finales
"As open as possible, as closed as necessary"
“Tan abiertos como sea posible,
tan cerrados como sea necesario”
- Data journals
- Como información
suplementaria junto al artículo de revista
- Repositorios
(institucionales, de datos, etc.)
Comprobar posibles requerimientos
(financiadores,
revista, etc.).
Repositorios para el depósito de los datos finales:
re3Data - Registry of Research Data Repositories:
https://www.re3data.org/search
Atención: los repositorios (de datos)
institucionales generalmente solo permiten el depósito a
miembros de la institución.
https://zenodo.org/
- Repositorio más habitual en la disciplina.
- Repositorios multidisciplinares. Por ejemplo:
https://commons.datacite.org/repositories?query=
https://www.coretrustseal.org/why-certification/certified-repositories/
La importancia de los repositorios en la preservación
Plan de preservación de e-cienciaDatos:
http://www.consorciomadrono.es/docs/PlanDePreservacion.pdf
Buenas prácticas: citas http://hdl.handle.net/20.500.11967/72
https://citation.crosscite.org/
http://uc3m.libguides.com/guias_tematicas/citas_bibliograficas - APA
Citar datos: recursos
Los repositorios suelen incluir
herramientas para elaborar las citas.
9. Ejemplos de uso:
Consorcio Madroño
http://www.consorciomadrono.es/investigam/
Plan de Gestión de Datos
Para cualquier investigad@r
Abierto a cualquier investigad@r
http://www.consorciomadrono.es/in vestigam/pagoda/
PR ÓXIMAMENTE: AR GOS
Repositorio para el depósito de los datos finales: e-cienciaDatos
https://edatos.consorciomadrono.es/
Guía ¿Cómo depositar sus datos?
http://www.consorciomadrono.es/wp-content/up loads/2019/07/guia_gestion_datos_investigacion
_2019-04-05.pub_.pdf
Para personal investigador de las universidades que forman parte
del Consorcio Madroño .
Grupo Técnico Iberoamericano de Dataverse
Instituto Brasileiro de Informação em Ciência e Tecnologia Consorcio Madroño
Consorcio de Servicios Universitarios de Cataluña Universidade de Aveiro
Universidad Católica del Perú Universidad de Chile
Universidad Nacional del Rosario (Argentina)
Universidad del Rosario (Colombia)
¿Qué datos se pueden depositar?
Conjuntos de datos de cualquier disciplina del personal docente e investigador de
las universidades del Consorcio Madroño. Datos finales o datos completos,
preparados para su distribución pública y su reutilización. Deberán contener la
pertinente documentación anexa (readme.txt).
¿Qué es una plantilla “readme.txt”?
Es una plantilla para generar un documento donde se proporciona información sobre los datos para que sean comprensibles y reutilizables: autoría, título, descripción, metodología, proyectos financiadores, cobertura temporal y geográfica, derechos de uso y privacidad, etc.
Los gestores del repositorio e-cienciaDatos utilizarán la información proporcionada en la plantilla readme.txt para:
● cumplimentar los metadatos estandarizados que describen el dataset y que son recolectados por diversos servidores científicos.
● elaborar un fichero readme.txt que se incluirá junto al resto de ficheros del dataset.
https://edatos.consorciomadrono.es/readme.xhtml
readme.txt
DOI
https://doi.org/10.21950/1YOPT9
GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M Depósito de datos en e-cienciaDatos
1.- Cumplir requisitos de publicaciones periódicas que exigen tener depositados en un repositorio los datos que validen los resultados de investigación de un artículo que se vaya a publicar.
- Inmediata asignación de DOI para incluirlo en el artículo.
- Una vez aceptado y publicado el paper, lo depositamos en e- Archivo (repositorio institucional) en acceso abierto (comprobar
política editorial).
- Completar información sobre la publicación en los metadatos e-
cienciaDatos.
GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M
Depósito de datos en e-cienciaDatos
GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M Depósito de datos en e-cienciaDatos
2.- Cumplir requisitos de instituciones financiadoras.
FAIR
GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M Depósito de datos en e-cienciaDatos
3.- Grupo de investigación - Crear Dataverse
- Persona de contacto
- Procedimiento establecido
- Depósito de publicaciones en e-Archivo
Ejemplo: Grupo de investigación Nonlinear Solid Mechanics
https://edatos.consorciomadrono.es/dataverse/nonlinear_solid_mechanics
GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M Depósito de datos en e-cienciaDatos
4.- Proyecto de investigación - Crear Dataverse
- Persona de contacto
- Procedimiento establecido
- Depósito publicaciones en e-Archivo - Web institucional
Ejemplo: Proyecto EMPATÍA-CM
https://edatos.consorciomadrono.es/dataverse/empatia
GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M
Depósito de datos en e-cienciaDatos 5.- Humanidades Digitales
1ª opción:
- datasets en e-cienciaDatos
Ejemplo:
Federico-Tena World Trade Historical Database www.uc3m.es/tradehist_db
http://hdl.handle.net/10016/27666
GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M
Depósito de datos en e-cienciaDatos 5.- Humanidades Digitales
2ª opción:
- otras plataformas: Omeka S, MySQL
- dataset anexos/finales en e-cienciaDatos Ejemplo:
Diccionario Biográfico de
Colegiales Mayores Españoles
www.uc3m.es/colegiales
https://doi.org/10.21950/1YOPT9
GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M
Depósito de datos en e-cienciaDatos
6.- Datos de capítulos de monografías o monografías
Historia del Derecho
http://hdl.handle.net/10016/14846Historia de las Universidades
http://hdl.handle.net/10016/3385https://directory.doabooks.org/browse?type=publisher&value=Universidad+Carlos+III+de+Madrid.+Figuerola+Institute+of+Social +Science+History
http://hdl.handle.net/10016/34610
GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M Depósito de datos en e-cienciaDatos
Handle e-Archivo
GESTIÓN DE DATOS DE INVESTIGACIÓN EN LA UC3M Depósito de datos en e-cienciaDatos
Metadato:
dc.relation.dataset
10. Material de apoyo
Material de apoyo:
- CEPAL. Gestión de datos de investigación: https://biblioguias.cepal.org/gestion-de-datos-de-investigacion - CODATA. Research Data Management Terminology:
https://codata.org/initiatives/data-science-and-stewardship/rdm-terminology-wg/rdm-terminology - Digital Curation Centre. Checklist for a Data Management Plan. v.4.0. Edinburgh:
http://www.dcc.ac.uk/sites/default/files/documents/data-forum/documents/docs/DCC_Checklist_DMP_v3.pdf - InvestigaM: Portal de Ciencia Abierta del Consorcio Madroño:
http://www.consorciomadrono.es/investigam/
- LA Referencia - Politicas para la Ciencia Abierta y los Datos Cientificos en America Latina (2018):
https://www.lareferencia.info/es/recursos/ciencia-abierta-documentos-externos/77-la-referencia-politicas-para-l a-ciencia-abierta-y-los-datos-cientificos-en-america-latina-es
- Maredata. Recomendaciones para la gestión de datos de investigación: http://hdl.handle.net/10261/173801 - MIT. Data Management. Workshops: https://libraries.mit.edu/data-management/services/workshops/
- REBIUN. Infografías sobre datos de investigación:
https://www.uc3m.es/biblioteca/publicacion-difusion-cientifica/datos-investigacion/clave-gestion - Science Europe. Research Data Management:
https://scienceeurope.org/our-priorities/research-data/research-data-management/
- Universidad Carlos III de Madrid. Servicio de Biblioteca. Datos de investigación:
Rebeca Marín: [email protected] Eva Ortiz: [email protected]
¡Gracias!
Imagen: https://pixabay.com/images/id-2502935/