INTRODUCCIÓN A LOS DATOS DE INVESTIGACIÓN LUIS MARTINEZ URIBE Formar jóvenes investigadores en el acceso abierto al conocimiento Long Tail Of Science ¿Qué son los datos? Research data: The data, records, files or other evidence, irrespective of their content or form (e.g. in print, digital, physical or other forms), that comprise research observations, findings or outcomes, including primary materials and analysed data. Monash University Research Data Policy Formatos • • • • • • • Texto Numérico Multimedia Modelos Software Disciplinares De instrumentos Objetos • • • • • • • • • • • Documentos de texto Cuadernos de laboratorio Cuestionarios Cintas y casetes Fotos y películas Diapositivas, artefactos, especímenes, muestras Colección de objetos digitales adquiridos durante la investigación Archivos estadísticos Bases de datos Modelos, algoritmos Metodologías y procesos ¿POR QUÉ TENEMOS QUE GESTIONAR LOS DATOS ADECUADAMENTE? • • • • • Imagen de http://blog.codinghorror.com/international-backup-awareness-day/ No perderlos Reproducibilidad Transparencia Reutilización Además… Requisitos de las agencias de financiación “… open access to scientific data should be adopted as the international norm for the exchange of scientific data derived from publicly funded research.” OECD Principles and Guidelines for Access to Research Data from Public Funding (2004-2007) “requires, in all proposals a supplementary document of no more than two pages describing a Data Management Plan for the proposed research. “ The National Science Foundation, January 2011 “…primary data, as well as data-related products such as computer codes, is deposited in the relevant databases as soon as possible, preferably immediately after publication and in any case not later than six months after the date of publication.” European Research Council , Open Access Guidelines for Researchers, June 2012 Requisitos e incentivos de las revistas y editores Requisitos de las Universidades “Research data of future historical interest, and all research data that represent records of the University, including data that substantiate research findings, will be offered and assessed for deposit and retention in an appropriate national or international data service or domain repository, or a University repository.” Edinburgh University Data Policy 2011 RETOS de los investigadores Planificar la gestión Encontrar datos secundarios Crear y almacenar Documentar Transformar e integrar Analizar y visualizar Publicar y compartir Planes de gestión “Documentos que describen que harás con tus datos durante tu investigación y una vez que termines con tu proyecto” Herramientas • DMPTool • DMPOnline ¿DÓNDE ENCONTRAR DATOS SECUNDARIOS ? • Centros de datos e institutos estadísticos – http://www.ine.es/ – http://epp.eurostat.ec.europa.eu/porta l/page/portal/eurostat/home/ • Repositorios de datos internacionales – http://databib.org/ – https://www.datacite.org/repolist – http://www.re3data.org/ • Páginas web de investigadores • Portales de Open Data – https://open-data.europa.eu/en/data/ – http://datos.gob.es/ • Páginas estadísticas de organizaciones internacionales – http://data.un.org/ – http://data.worldbank.org/ Imagen de http://www.keepcalm-omatic.co.uk/product/poster/keep-calmand-use-secondary-data CREAR Y ALMACENAR DATOS Herramientas de encuestas Instrumentos con Open Source Hardware Imágenes e información de: http://www.appropedia.org/Building_research_equipment_with_free,_open-source_hardware Organizar los datos • Ficheros de datos y carpetas tiene que denotarse y organizarse de forma sistemática. • Criterios • Organización • Contexto • Consistencia • Research Data Mantra – Organising data http://datalib.edina.ac.uk/mantra/organisingdata/ Donde almacenarlos • Servidores en red – Gestionados por informáticos – Con back-ups • Ordenadores personales y portátiles – Discos duros pueden fallar – Portátiles se pueden perder • Unidades de almacenamiento externo – Longevidad no garantizada – Fácilmente se estropean o pierden Fotos tomadas de www.data-archive.ac.uk/ukda40/ DOCUMENTAR Image from http://www.libraries.rutgers.edu/researchers/data_services Curso de metadatos MANTRA http://datalib.edina.ac.uk/mantra/documentation_metadata_citation/ ANALIZAR Y VISUALIZAR TRANSFORMAR E INTEGRAR http://asksomu.com/blog/tag/java/ Imágenes de: https://blog.scraperwiki.com/2011/06/knight-foundation-finance-scraperwiki-for-journalism/ http://ti3.ceiec.es/taller-de-web-scraping-en-medialab-prado/ Open Refine Imagen de https://www.flickr.com/photos/cogdog/ PUBLICAR Y COMPARTIR Licencias • Tipos – – – – – – • • http://www.slideshare.net/AlexBall/ball2011ddh-slides Creative Commons Open Data Commons Open Government Licence GILF/AusGOAL Licences Design Science Licence Public Domain http://www.dcc.ac.uk/resources/howguides/license-research-data http://www.ausgoal.gov.au/research-datafaqs