curso2006alicialopezmedina.ppt

Anuncio
“El acceso abierto a las
publicaciones científicas en la
Comunidad de Madrid”
Cursos de verano 2006
El Escorial,
Universidad Complutense
Marco del proyecto
Constituye una de las líneas de actividad del
Programa de Cooperación Interbibliotecaria
enmarcado en el Contrato Programa entre la
CAM y las Universidades, para la regulación
del marco de cooperación en el Sistema
Regional de Investigación Científica e
Innovación Tecnológica IV PRICIT (20052008).
Nuestro proyecto
Una iniciativa conjunta de las Universidades del
Consorcio Madroño (Universidades públicas
de Madrid y la UNED) y de la Comunidad de
Madrid para crear una plataforma digital de
acceso libre a la producción científica de las
Instituciones de investigación de la Comunidad
de Madrid.
Plazo de ejecución: 2005-2008
Sus objetivos



Dar soporte a las iniciativas de comunicación
científica en acceso abierto de los
investigadores de la Comunidad de Madrid.
Ofrecer un espacio de acceso abierto a la
ciencia y el conocimiento.
Incrementar la difusión, la visibilidad y el
impacto de la investigación científica
madrileña.
Modelo datos/servicios


Nivel de datos: infraestructura de adquisición,
organización, gestión, almacenamiento y
disponibilidad de los contenidos.
Nivel de servicios: construcción de servicios
sobre la agregación de los contenidos
disponibles en la infraestructura de datos.
Modelo datos/servicios: soportado sobre el
protocolo OAI-PMH

Nivel de datos: red de repositorios
institucionales

Nivel de servicios: proveedor de
servicios/portal web
Modelo:datos/servicios
Responsabilidades individuales/acciones conjuntas:
 Cada Institución es responsable de su propio
repositorio, tiene sus propias motivaciones para
crearlo y decide cómo quiere organizarlo: es el
responsable de tener los contenidos seguros y
disponibles.
 Las acciones conjuntas se centran en aquellas que
aseguren la interoperabilidad y la integración de estos
repositorios a todos los niveles para que sea posible la
construcción de los servicios.
Nivel de datos







Repositorios participantes
Arquitectura
Tecnología
Contenidos
Cuestiones legales
Apoyo institucional
Políticas
¿Qué es un repositorio
institucional?
“Un conjunto de servicios que una Institución ofrece a los
miembros de su comunidad para la gestión y la
difusión de los materiales digitales creados por la
Institución y la comunidad de sus miembros.
Esencialmente supone un compromiso de
organización para el control de esos contenidos,
incluyendo su preservación en el tiempo así como su
organización y acceso o distribución”
Institutional Repositories: Essential Infrastructure for
Scholarship in the Digital Age
by Clifford A. Lynch, 2003
Características
Un repositorio institucional consiste en hardware, software, datos y
procedimientos que:





Contiene objetos digitales que representan cualquier tipo de
producción científica de una Institución de investigación y ciencia.
Asegura la identificación persistente del objeto mediante los
metadatos y un identificador único persistente.
Ofrece funciones de gestión y archivo de los objetos
Proporciona un acceso fácil y estandarizado, aumentando así su
visibilidad e interoperabilidad
Ofrece los sistemas adecuados de seguridad para los objetos y
los metadatos.
¿Qué es un repositorio
institucional abierto?


El mismo repositorio pero que además permite
a sus usuarios el acceso libre a sus contenidos
Un repositorio conforme con el protocolo OAIPMH, es decir, un servidor capaz de responder
a las peticiones de un “harvester”
Desde la perspectiva del “open
access”
“Green road”: una de las rutas hacia el acceso
abierto según el acuerdo de Budapest, en la
que los autores continúan publicando en las
revistas científicas de suscripción tradicionales
y de forma paralela AUTO-ARCHIVAN esos
trabajos en archivos abiertos (entre otros los
repositorios institucionales que les proporcione
su institución)
Repositorios participantes (por
ahora)
Universidad de Alcalá
 Universidad Autónoma de Madrid
 Universidad Carlos III de Madrid
 Universidad Complutense de Madrid
 Universidad Nacional de Educación a Distancia
 Universidad Politécnica de Madrid
 Universidad Rey Juan Carlos
+ Un archivo abierto independiente creado para alojar los
contenidos de científicos e investigadores que no
dispongan de repositorio institucional o que así lo
decidan.

Arquitectura distribuida abierta
¿Por qué no hemos creado un solo repositorio para
todos?


No existe una única solución que sirva para todos.
Existe el protocolo OAI-PMH.
Además...
Arquitectura: otras razones






Escalabilidad
Internacionalidad
Su carácter institucional
Integración
Los propios fines de un repositorio institucional
El auto-archivo
Arquitectura: escalabilidad
Crear un único repositorio centralizado no es una
arquitectura viable ya que no escalaría bien
dado el tamaño y número potenciales de
objetos digitales que se acumularán con el
tiempo.
Arquitectura: internacionalidad
El modelo distribuido es el subyacente a la
tecnología abierta y sigue la dirección de la
mayoría de los proyectos que se han
desarrollado internacionalmente en relación
con el acceso abierto.
Arquitectura: institucionalidad
Permite a cada nodo o repositorio de la red la
definición de sus propias políticas locales en
relación con la gestión de sus contenidos y
ofrece una herramienta básica para garantizar
un almacenamiento digital estructurado fiable
de su propia propiedad intelectual.
Arquitectura: integración
La arquitectura distribuida facilita la integración de otros
nodos a la red que pueden no tener la naturaleza
institucional, por ejemplo los archivos abiertos
disciplinarios o pertenecer a Instituciones con otras
características, por ejemplo hospitales, que no se
adaptarían bien a un repositorio institucional
centralizado.
Permite, además, a cada nodo de la red su integración
independiente en otras redes.
Arquitectura: fines de un
repositorio institucional
El “open access” no es el único fin por el que una
Institución crea un repositorio institucional.
 Dar visibilidad y difusión a los resultados de su
actividad científica y académica con una cierta imagen
de “marca”: ser indicador de prestigio.
 Asegurar la preservación de su producción intelectual
 Ofrecer una visión contextualizada de su actividad
científica.
 Ofrecer a su comunidad una herramienta de gestión
de sus contenidos digitales.
Arquitectura: auto-archivo
Es más fácil si estamos cerca de donde se crean
y se auto-archivan los contenidos.
Distribuidos, pero juntos
¿Por qué juntos?
- Podemos ofrecer una visión global de la ciencia de nuestra región
Supone una muestra más significativa de lo que está sucediendo
en las distintas disciplinas científicas
- Es más fácil conseguir financiación
- Se tiene más peso específico y por tanto más fuerza cuando hay
que convencer o pedir.
- Las políticas necesarias para que el acceso abierto sea posible se
facilitan si el proyecto es colectivo.
- Se alcanza más rápidamente una masa crítica de contenidos
Qué tecnología
El proyecto no establece ninguna imposición
respecto a la tecnología utilizada salvo:
- Que sea conforme con el protocolo OAI-PMH
- Que utilice las herramientas disponibles en el
contexto de la OAI (Open Archive Initiative)
- Que esté construido con estándares abiertos y
aceptados internacionalmente.
Software
Sigue funcionando la regla de que no hay una
única solución válida para todos:
- Dspace
- Eprints
CÓDIGO ABIERTO
- Fedora
* Digitools
Software de código abierto
Programas que permiten acceder a los códigos
fuente.
 ejecutar el programa para cualquier propósito
 estudiar, modificar y distribuir libremente el
original,copias y modificaciones (haciendo
constar quién las ha hecho)
El código abierto es una nueva forma de
construir software
Ventajas del código abierto






Evoluciona más rápida y orgánicamente: muchos
individuos y equipos trabajando en paralelo e
intercambiando conocimiento
Responde mejor a las mejoras y desarrollos locales
(no responden a intereses comerciales)
Nuevas versiones más frecuentes
La seguridad se mejora porque el código está
expuesto al mundo.
Ahorra costes (no es gratis, pero permite diferentes
tipos de decisiones presupuestarias)
Podemos desarrollar nuevas funcionalidades a nuestro
propio ritmo
Software de código abierto disponible
A Guide to Institutional Repository Software v 3.0
Contenidos




De carácter erudito: tanto de naturaleza científica
como académica
Producido, enviado o patrocinado por un miembro
de la comunidad científica o cualquier otro agente
autorizado por la política de la Institución
No efímero: el trabajo debe estar completo y
preparado para su distribución
Licenciado a perpetuidad: el autor debe ser capaz y
tener la voluntad de ceder, no en exclusiva, a la
Institución el derecho a preservar y distribuir su trabajo
a través del repositorio
Contenidos


Equivalentes a los impresos: artículos de
revistas, ponencias, tesis, capítulos de libros,
informes técnicos, monografías... (e-prints)
Contenidos audiovisuales, multimedia,
imágenes...
Contenidos: "eprints" = preprints +
postprints.
Un “eprint” es la versión digital de un documento
científico (generalmente un artículo, pero puede ser
también una tesis, una ponencia, un capítulo de libro o
un libro) que es accesible en línea normalmente a
traves de un archivo o repositorio digital (ya sea
institucional, disciplinario o de cualquier otro tipo)
El término "eprint" abarca tanto el término “preprint” (el
documento antes de ser revisado por pares) como
postprints (después de haber sido revisado
Distinguiremos entre aquellos documentos depositados
que han sido revisados por pares y aquellos que no lo
han sido para garantizar a los autores y usuarios la
certificación científica de los contenidos.
Contenidos


Objetos de aprendizaje: generados en el contexto del “elearning”: otros esquemas de metadatos, otra mentalidad, otras
necesidades de uso y reutilización, otras funciones, más
complejidad en el tema del copyright y el acceso abierto. Es
esencial que nuestros repositorios sean capaces de integrarse en
un servicio transparente: interoperabilidad.
Objetos generados en el contexto de la “e-ciencia”: datasets.
Repositorios de data. Requieren urgente análisis si queremos
realmente dar cobertura al proceso integral de las nuevas formas
de hacer ciencia en el contexto de la tecnología Grid.
“llenar”de contenidos los
repositorios



Mecanismos de alimentación directa de los
repositorios: “auto-archivo” (muy trabajoso)
Cargas de colecciones digitales de la
biblioteca u otras ya existentes en la
Universidad.
Procesos de digitalización retrospectiva:
hemos empezado con las tesis y las revistas.
Cuestiones legales


Licencia de depósito: dictámenes de las
respectivas asesorías jurídicas/licencias por
defecto en los propios programas. El acuerdo
entre la Institución y el autor para la
preservación, organización y distribución a
través del repositorio de los contenidos.
Licencia de uso: el acuerdo entre el autor y el
usuario final para el uso de los contenidos:
“creative commons”, “science commons”
Cuestiones legales: las editoriales

Aproximadamente el 94% de las principales
editoriales científicas del mundo permiten
algún tipo de auto-archivo en repositorios
institucionales
SHERPA
Políticas
Cada repositorio define las políticas locales respecto a
sus condiciones de auto-archivo, quién puede hacerlo,
condiciones para la preservación, organización de los
contenidos, procedimientos, etc.
De nuevo, el único compromiso, respecto al proyecto
común es asegurar la interoperabilidad y el acceso
abierto a los contenidos.
Nivel de servicios
Los repositorios deben ser considerados dentro de un contexto de
información más amplio. Crear una pequeña escala de silos de
información dentro de los repositorios no es una gestión de la
información muy estratégica en la era “Google”
La promesa de que los repositorios institucionales servirán de
soporte a la realización del “open access” y mejorarán la
comunicación científica depende de la existencia de proveedores
de servicios externos que exploten el conjunto de redes de
repositorios institucionales a escala global.
Para cumplir esta promesa los servicios deben ser construidos sobre
una agregación coherente de contenidos provenientes de una red
de repositorios institucionales
Nivel de servicios


Un servidor para el proveedor de servicios,
alojado y mantenido en la sede del Consorcio
Madroño
Un portal web de acceso a la interfaz de
búsqueda del proveedor de servicios + valores
añadidos, alojado, creado y mantenido por la
Comunidad de Madrid en su espacio Madri+d
El proveedor de servicios





Hemos utilizado el software ARC –código abierto- (es
el mismo que utiliza el servicio OAISTER)
El responsable de Madroño trabaja directamente en el
desarrollo de mejoras y nuevas propuestas del
software con su creador Xiaoming Liu.
El proveedor de servicios recolectará los metadatos de
los repositorios participantes y, en fases sucesivas,
podrá recolectar aquellos repositorios disponibles que
considere oportuno incluir en el portal.
El proveedor de servicios podrá ser también proveedor
de datos para otros proveedores de servicios.
Los metadatos serán recuperables también por Google
Servicios sobre los metadatos
recolectados
Búsqueda simple (ya lo ofrece ARC)
 Búsquedas avanzadas (por campos) (ya lo ofrece
ARC)
El punto fuerte que queremos ofrecer es la definición de
SETS para permitir la navegación organizada por
subcolecciones de materias y tipos de documentos.
Los sets permitirán dar una muestra significativa del peso
específico de una determinada disciplina en el
conjunto de la ciencia de la Comunidad de Madrid.

Otros servicios en fases sucesivas








Generación y visualización de estadísticas integrada
Herramienta de citas
Búsqueda a texto completo
Generación de presentación de contenidos
personalizada
Herramientas para la creación colaborativa de
documentos
Sistema de búsqueda y recuperación multilingüe
Control de metadatos
Servicios de anotación
El portal web de acceso en madri+d









Acceso a cada uno de los repositorios individuales participantes +
repositorio independiente
Asesoramiento sobre los procedimientos de “auto-archivo”
Acceso a la interfaz de búsqueda común del proveedor de
servicios
Servicios de valor añadido
Novedades sobre el desarrollo del proyecto
Información sobre el movimiento OA a nivel mundial
Actividades de difusión y formación: blog “open access” en
madri+d
Asesoramiento jurídico
Foro de consultas
Organización del trabajo




Grupo de Gestión
Grupo de trabajo – wiki Madroño
(http://www.consorciomadrono.net/prebienv.ht
m)
Grupo de Actividad: consejo asesor
Participantes asociados
El camino por delante:

Motivar al autor
hacer que el auto-archivo sea lo más fácil y simple posible y que el “open
access” sea “respetable” (sistemas alternativos de revisión por pares y
sistemas alternativos de evaluación de los resultados de la investigación
científica) estímulos económicos, profesionales, marco legal claro y
seguro, mandato

Motivar a la Institución: demostrar los beneficios a la Institución

Motivar a los usuarios locales/externos : servicios de valor añadido

Lograr apoyo político: alianzas y grupos de presión.

Coordinar las estrategias a nivel nacional, sobre todo en lo relativo al
desarrollo del nivel de servicios y federación de redes.
Algunas tecnologías a observar
En el contexto de la investigación científica, los
investigadores piensan más en términos de líneas de
investigación y en compartir y por supuesto trabajar
con colegas que pueden pertenecer a diferentes
instituciones nacionales o internacionales.
Están proliferando nuevas herramientas de colaboración
que ofrecen formas más informales de comunicación y
de gestión de acceso a los contenidos:
Blogs
Wikis
P2P
Algunas cuestiones para el debate







¿Qué es un repositorio institucional?
¿En qué se va a convertir cuando se haga “mayor”?
¿Qué funciones debe cumplir?
¿Qué contenidos deben guardarse en un repositorio institucional?
Sólo el 15% de la investigación anual del planeta está disponible
en acceso abierto: es esto significativo para decir que son una
alternativa a la publicación científica tradicional?
Pueden llegar a ser los repositorios institucionales una rémora
para el “open access” (podemos esperar al “mandato”?)
¿Auto-archivar es “publicar”: son los repositorios institucionales
capaces de ofrecer una vía “respetable” de publicación científica?
Nuestra visión de futuro



Una red nacional distribuida de repositorios abiertos
(institucionales, independientes, disciplinarios)
Un portal nacional de acceso abierto a la ciencia en
España: evaluación/revisión/índice de citas/...
Integración de la ciencia española en las redes
globales del conocimiento
del 15% al 100%
“La disponibilidad universal del conocimiento
humano que ha sido aprobado por la
comunidad científica y académica”
¡MUCHAS GRACIAS!
Alicia López Medina
Biblioteca UNED
alopezm@pas.uned.es
Descargar