LA NORMALIZACION DE FORMATOS PARA EL INTERCAMBIO DE

Anuncio
LA NORMALIZACION DE FORMATOS PARA EL INTERCAMBIO DE INFORMACION
EN SOPORTE LEGIBLE POR MAQUINA
Moya, F.; Hípola, P. «Format Standardisation for the exchange of machine
readable information». En: Informatique et Libertés. Poitiers (Francia) 1989.
Félix de Moya, Pedro Hípola
E. U. de Biblioteconomía y Documentación
Universidad de Granada (España)
INTRODUCCION
A lo largo de este seminario se están analizando diversos
problemas relacionados con la regulación jurídica de la
información que se procesa por medio de sistemas informáticos.
Para abordar adecuadamente este asunto es necesario asumir
cuáles son las características de un conjunto de herramientas
básicas. Así, por ejemplo, es imprescindible considerar nociones
como la de fichero informático, carácter, protocolo, cuáles son
los distintos tipos de ficheros, de bases de datos, etc. Las
tëcnicas no sólo de la informática, sino tambiën otras tëcnicas
usuales en telecomunicaciones sobre todo los procesos
"telemáticos". Una vez delimitadas estas nociones elementales,
cabe plantearse cuestiones cruciales como la regulación de
cuáles pueden ser las informaciones susceptibles de ser
incluidas en tales ficheros informáticos. El problema cobra
particular importancia cuando se trata de ficheros que se pueden
considerar, por algôn motivo, ficheros "pôblicos". La regulación
del acceso a esta información registrada en soporte legible por
máquina puede afectar directamente a derechos de los ciudadanos,
de las instituciones, sociedades privadas, etc.; en ôltima
instancia a la libertad de los hombres.
Sin duda todas estas cuestiones están siendo abordadas por
juristas especializados en este ámbito. En nuestra presentación,
sin embargo, se va a tratar otra temática, algo diferente, pero
estrechamente relacionada con los problemas que se acaban de
citar. Se pretende ofrecer una exposición sobre algunos
condicionantes que aparecen cuando se desea llevar a cabo el
intercambio de información entre dos o más ordenadores.
Existe una tendencia a pensar que los actuales sistemas
telemáticos en funcionamiento son capaces, entre otras cosas, de
intercambiar fácilmente entre sí todo tipo de informaciones. Lo
cual sería una fuente añadida de peligros de desprotección para
los ciudadanos: vulneración del derecho a una cierta intimidad,
posibles abusos por parte de las personas y/o instituciones que
controlan las informaciones legítimamente. O, peor aôn, uso
ilegítimo por parte de quien pueda apropiarse indebidamente de
los datos almacenados en algôn soporte informático.
Este
planteamiento, que ciertamente es acertado en muchos de sus
aspectos, sin embargo no puede ser completamente sostenido hoy
día. Y ello es debido a que, en contra de lo que gran parte del
pôblico tiende a pensar, no existe tanta facilidad de
comunicación entre los diversos sistemas existentes en el
mercado. O, al menos, la posibilidad de intercambiar
informaciones no se puede llevar a cabo todavía de una forma tan
"transparente" como para que la transferencia favorezca
suficientemente la gestión de los datos que se reciben. Existen
diversos niveles de incompatibilidad que obstaculizan los
procesos de intercambio. Consiguientemente nos encontramos con
una serie de limitaciones, que en este caso van a afectar a las
personas e instituciones que se encarguen de gestionar las
distintas bases de datos.
En este seminario probablemente se resaltará la necesidad
de una adaptación del derecho, que garantice las libertades
fundamentales de las personas físicas o jurídicas. En algunos
casos será necesario limitar los tipos de informaciones que se
puedan procesar. En otras ocasiones habrá que prohibir a
determinados ciudadanos el acceso a ciertas informaciones. Pero,
junto con todo esto, debemos indudablemente asumir una realidad:
necesitamos cada día más poder disponer de informaciones
almacenadas en soportes informáticos. Y además necesitaremos
disponer de ellas para que puedan llevarse a cabo intercambios
de datos, textos, etc., entre ordenadores de distintas personas
e instituciones. Cada vez serán más las informaciones que se
gestionen de manera mecanizada, por evidentes motivos de
eficacia y rapidez en la gestión. Intentar defender una postura
contraria a esta realidad sería, a nuestro juicio, un
despropósito. Por tanto, limitando lo que haya que limitar, hay
que trabajar para establecer modos de operar que permitan
superar estos niveles de incompatibilidad a los que nos acabamos
de referir.
Una buena parte de los problemas que habrá que superar son
cuestiones tëcnicas que conciernen ônicamente a especialistas en
informática, fabricantes de sistemas, asociaciones de usuarios
de software, hardware y telecomunicaciones... Pero existe otro
conjunto de requerimientos que han de ser abordados por personal
especializado en temas jurídicos. Entre ëstos un lugar
primordial corresponde a la necesidad de normalizar formatos de
documentos para el intercambio de información en soporte legible
por máquina. Sobre esta cuestión nos centraremos ahora.
LA NECESIDAD DE NORMALIZAR
Tratemos de identificar, en primer lugar, por quë es
necesario normalizar los formatos.
Es un hecho por todos conocido el constante aumento de la
demanda, y sobre todo de la oferta, de informaciones registradas
en soportes informáticos. Es algo relacionado con el crecimiento
del llamado "mercado de la información electrónica". Estas
informaciones en muchos casos pueden servir para satisfacer las
necesidades de usuarios dispersos geográficamente. El modo de
proporcionárselas puede estar basado en uno de estos dos
procedimientos de gestión de datos:
1.explotación online de la oferta disponible, y
2.intercambio de información entre los sistemas existentes.
El primero de los mëtodos citados presenta ciertamente
ventajas considerables, como por ejemplo la posibilidad de
acceder a información constantemente actualizada. Sin embargo,
tambiën hay que asegurarse de que se cumplen algunas exigencias
indispensables para que el sistema sea suficientemente eficaz,
fiable, de rápida respuesta, etc. Se requiere, por una parte, un
nômero de líneas de telecomunicaciones disponibles tanto mayor
cuanto mayor es el conjunto de usuarios que han de acceder a los
ficheros existentes. El inconveniente fundamental de este
requerimiento es de índole económica: los costos de instalar y
explotar la infraestructura tecnológica necesaria. Además, hay
que recordar que esta infraestructura no funciona en todas
partes de una forma lo suficientemente adecuada. En lo que a
Europa se refiere podemos traer a la memoria la estadística
publicada no hace mucho por EUSIDIC (European Association of
Information Centers). Las cifras que se dieron a conocer
pusieron de manifiesto el estado de la cuestión, que se puede
considerar algo precario en lo que se refiere al funcionamiento
de la red especial de transmisión de datos por conmutación de
paquetes dentro de los países miembros de la Comunidad Europea.
La explotación online requiere, por otra parte, la
utilización de una serie de recursos software. Estos se han de
encargar de gestionar los procesos a los que las informaciones
van a ser sometidas para satisfacer las necesidades de los
usuarios. En la medida en que el nômero de usuarios sea mayor,
evidentemente el tipo de necesidades aumenta, y además se
diversifica. Consiguientemente, se multiplica la variedad de
procesos, de vías de acceso a las bases de datos, de formatos de
presentación de la información y de un gran conjunto de
planificaciones necesarias para ofrecer las prestaciones que se
le van a exigir al sistema. En definitiva, se trataría de
desarrollar un completo software de recuperación de información
con una considerable versatilidad. Esto tambiën es costoso
En contraposición a la explotación online, deseamos aquí
exponer las características de un mëtodo de trabajo orientado al
intercambio de información. La tendencia propia de este modo de
trabajo es operar de forma que se pueda garantizar en todo
momento que en el intercambio de datos no se produzcan ni
përdidas ni distorsiones. Actuar habitualmente de este modo
ofrece, entre otras, las siguientes ventajas:
A.reducción de costos, ya que los principales procesos se
verifican a nivel local;
B.resulta más factible adaptar las "performances" de la
recuperación de información a los usuarios, por el mismo motivo.
Se pueden respetar así distintas idiosincrasias de diferentes
usuarios.
Un modo de operar que reôna estas características debe
estarbasado en un consistente sistema de normalizaciones:
normalización de soportes, y
normalización de formatos.
En lo que a los soportes se refiere, cualquier tipo de
información textual, sonora, gráfica, audiovisual puede hoy día
ser almacenada en soportes normalizados controlables por
ordenador. Estos standards han sido desarrollados por
fabricantes de amplia presencia en el mercado de la tecnología o
por organismos de normalización nacionales o internacionales.
Por el contrario, resulta más difícil encontrar normas de
formatos standard para albergar la información. Y aquí, al decir
información nos referimos al sentido más propio de la palabra.
No a meras "señales" transmitidas por dispositivos, sino a
"datos" dotados de una carga "semánticoconceptual".
A nuestro juicio el problema fundamental para garantizar la
operatividad de un "modus operandi" dirigido al intercambio de
información en soportes legibles por máquina es que los
organismos internacionales definan las características
fundamentales de formatos standard para albergar los diversos
tipos de informaciones contenidas en la documentación que se
desea procesar. Parece deseable alcanzar al menos un nivel de
normalización similar al existente en el ámbito de los soportes.
COMO LLEVAR A CABO LA NORMALIZACION
Si estamos de acuerdo en la necesidad de la normalización
de formatos segôn el planteamiento precedente, podríamos
formularnos algunas preguntas: ¿quiën puede tener autoridad para
aprobar normas de este tipo? ¿Cuál es la situación actual a
nivel internacional en estos asuntos? ¿Quë intereses se podrían
hayar involucrados en un proyecto de tales características?
Evidentemente, sea cual sea el planteamiento que nos hagamos,
concluiremos que es necesario articular líneas de actuación de
carácter eminentemente político.
Existen organismos nacionales de normalización, como AFNOR
(Association Française de Normalisation) en Francia, UNI (Ente
Nazionale Italiano di Unificazione) en Italia, BSI (British
Standards Institution) en el Reino Unido, DIN (Deutsches
Institut für Normung) en la RFA, AENOR (Asociación Española de
Normalización) en España, etc. Por otra parte, contamos con
organismos de ámbito regional, como el CEN (Comitë Europeen de
Normalisation). Y, por ôltimo, organismos de alto alcance
internacional. A la cabeza está ISO (International Standards
Organization). Si deseamos ser exhaustivos habría que añadir los
organismos internacionales de normalización de carácter
sectorial que podrían estar relacionados, al menos remotamente,
con el tema. Ciñëndonos exclusivamente al ámbito europeo, se
podrían citar, por ejemplo, ETSI (European Telecomunication
Standards Institute) o CEPT (Conferencia Europea de Correos y
Telecomunicaciones).
Sería muy de agradecer que las relaciones entre todos estos
organismos y otros que ahora omitimos se formulara de
maneraclara; que se garantizara, en la medida de lo posible, la
compatibilidad recíproca de las normas elaboradas por los
diferentes organismos. Sabido es que ësta no es precisamente la
tendencia habitual de los organismos nacionales. Por otra parte,
tambiën nos parece deseable que en el ámbito de la Comunidad
Europea se cuente con unas disposiciones legales lo
suficientemente precisas sobre organismos de normalización,
evitándose, por ejemplo, la duplicación de trabajos.
Quizá se podría citar como el caso más problemático en la
actualidad la falta de compatibilidad entre ciertas normas
proclamadas por ISO y los organismos de normalización de USA y
Japón. Los mayores productores del mundo en el área de la
informática y de las telecomunicaciones a menudo se basan, para
fabricar sus productos, en standards no compatibles con normas
ISO. Por citar un ejemplo conocido, nos podríamos referir a lo
difícil que resulta encontrar terminales de caracteres de 8 bits
ajustados a la normativa ISO. Sin embargo, resulta muy fácil
adquirir terminales ASCII (American Standard Code for
Information Interchange), standard americano.
En lo que se refiere a productos hardware y software
siempre nos estamos encontrando con intereses comerciales,
frecuentemente enfrentados con la compatibilidad de sistemas.
Pero quizá resultaría viable instar a los fabricantes a que
armonicen su oferta de acuerdo con un formato de registro para
el intercambio de información documental. Tal norma serviría de
intermediario entre distintos sistemas de información. Los
diseñadores particulares podrían mantener sus propias
especificidades. Simultáneamente deberían aceptar esa
arquitectura universal de formato de intercambio.
El proyecto debería ser fuertemente respaldado por los
organismos nacionales e internacionales de normalización. La
Comunidad Europea ha impulsado proyectos interesantes como el
del CCF (Common Communication Format) y FORMEX (FORMalized
Exchange of electronic publications). Si se continôa en esta
dirección, teniendo en cuenta la relevancia que el conjunto de
países miembros puede tener, quizá en un plazo relativamente
breve podría contribuir a que arraigue el formato.
CARACTERISTICAS DEL FORMATO
Siguiendo un modo de proceder ya utilizado en otros
standards, el proyecto de formato debería desarrollarse a dos
niveles:
1.nivel físico, y
2.nivel lógico.
Dentro del nivel físico, sería necesario, en primer lugar,
definir los elementos que permitan identificar la estructura de
dicho formato. No se debe definir una estructura sin antes
definir los elementos que van a identificar las partes de esa
estructura.
En el segundo de los niveles se trataría de definir
estructuras lógicas independientes para cada tipo documental que
se va a albergar en los registros. Así, por ejemplo, haría falta
una caracterización lógica para registros con informaciones
penales, otra para registros de la propiedad inmobiliaria, etc.
Existen distintas tipologías documentales administrativas en los
sistemas manuales que ahora se emplean. Es posible utilizar
dichas tipologías como base para diseñar los diversos formatos
lógicos que se usarán en los registros informáticos.
La estructura debe ser capaz de facilitar la transferencia
de informaciones de todo tipo:
información estructurada: como, por ejemplo, informaciones
factuales, cifras, datos codificados; e
información "desestructurada": cualquier tipo de
información que no estë formalmente estructurada, como, por
ejemplo, textos redactados en lenguaje natural libre. Así se
conseguiría que información desestructurada adquiera una
estructura que la haga manejable por un sistema informático.
Además, debe ser posible la integración de gráficos,
registros sonoros y audiovisuales. Interesaría aprovechar los
beneficios que va a aportar la Red Digital de Servicios
Integrados (RDSI), de cara a integrar, dentro de los mismos
soportes, información de procedencia digital o analógica
información analógica digitalizada.
Los proyectos EDI
Llegados a este punto, podríamos traer a colación la
existencia de una serie de standards de transferencia de
documentos en soporte legible por máquina. Han sido
desarrollados en algunos casos por fabricantes de amplia
presencia en el mercado informático. En otras ocasiones los han
elaborado organismos internacionales de normalización. Son los
proyectos EDI (Electronic Data Interchange). Se trata en la
mayor parte de las ocasiones de arquitecturas que se
desenvuelven sobre todo en el plano, por así decirlo, de la
"informaciónseñal". Su predecesor son las normas para
preformateo de documentos de IBM. Entre los standards más
prestigiosos se encuentra la norma X400, elaborada dentro del
ámbito del CCITT (Comitë Consultivo Internacional sobre
Telegrafía y Telefonía). Se trata de un modelo teórico de
comunicación de mensajes. Está diseñado para permitir la
interconexión de servicios de mensajes de orígenes diversos. La
norma se publicó en 1984 y ha sido revisada en 1988.
Por otra parte está EDIFACT, lenguaje normalizado para el
intercambio electrónico de datos a nivel internacional dentro
del ámbito de la Administración, el comercio y el transporte.
Está fomrmado por un conjunto de reglas de sintaxis al nivel de
aplicación de OSI (Open Systems Interconnection). El standard ha
surgido principalmente a partir de los trabajos del comitë
inglës Sitpro (Simplification of International Trade Procedures
Board),de Sitprofrance (Comitë Français pour la Simplification
des Procedures du Commerce International) y de ANSI (American
National Standards Institute). Ha sido aceptado por CEE/ONU
(Commision Économique pour l'Europe des Nations Unies). Tambiën
ha sido recientemente adoptado como norma por ISO (ISO 9735).
Desarrollados a partir de EDIFACT, se han preparado propuestas
de normas de mensajes para el intercambio de "pedidos" y de
"avisos de envío".
Tambiën es importante mencionar la propuesta ISO/DIS 8613.
Su aprobación como norma del JTC1 (Joint Technical Committee),
comitë mixto ISO/IEC (IEC= International Electrotechnical
Commission) estaba prevista para diciembre de 1988. ISO 8613
será una norma de representación de documentos concebida para la
transmisión electrónica. Es conocida como ODA/ODIF (Office
Document Architecture/Office Document Interchange Format). La
arquitectura incluye definición lógica de páginas, cuadros...
Tambiën está prevista la integración de textos y gráficos.
Citemos, por ôltimo, FORMEX (FORMalized Exchange of
electronic publications), norma para el almacenamiento de
información textual informatizada, preparada para posibilitar el
intercambio entre autores, editores y hosts. Está integrada por
la definición de caracteres (ISO 646, ISO2022 e ISO 6937) y por
las especificaciones de tratamiento de datos, basadas en ISO
2709, CCF e ISO 8879 (Standard Generalized Markup Language/SGML).
Nosotros, por nuestra parte, hemos de insistir en una idea
que ya hemos apuntado. En esta presentación se desea proponer la
implementación de formatos standard para albergar la información
documental en sí misma, esto es, datos dotados de una carga
"semánticoconceptual", no meras "señales" que se transmiten.
Desde esta perspectiva se podría afirmar que los proyectos EDI
citados articulan más bien especificaciones para estructurar
"señales" contenidas en formato de documento. O, como mucho,
contemplan definiciones lógicas que ofrecen la posibilidad de
transmitir documentos con información muy estructurada (como es
el caso, por ejemplo, de los "pedidos"). Además hay que añadir
que, con ser normas muy ôtiles, a veces son incompatibles con
formatos ya existentes y de amplio uso. En este sentido queda
mucho terreno por avanzar.
El caso MARC
Al afrontar el desarrollo del proyecto que proponemos,
sería recomendable evitar algunos errores como los que se han
cometido al elaborar ciertas normas. Querríamos exponer aquí un
caso que consideramos aleccionador, por sus aspectos positivos y
por algôn aspecto menos afortunado. Se trata de una arquitectura
de formato que se utiliza en un determinado contexto
profesional. No está relacionada directamente con la información
de tema jurídico, pero el planteamiento seguido para determinar
las especificaciones físicas y lógicas del formato puede ser en
gran medidaextrapolable a gran parte de los ambientes en los que
se ha de llevar a cabo una gestión documental.
En el ámbito de la Documentación contamos con una norma,
ISO 2709, que regula la disposición de los datos en soporte
informático para el intercambio de información bibliográfica.
Analizando la norma y la historia de su gestación y uso, se
pueden extraer algunas conclusiones interesantes. Sus orígenes
se remontan al final de la dëcada de los 50, cuando comienzan en
la Library of Congress de USA los primeros estudios sobre la la
posibilidad de automatizar algunas funciones. Es el inicio del
proyecto MARC (Machine Readable Cataloguing). Como participantes
en el proyecto son seleccionados inicialmente una serie de
centros bibliotecarios norteamericanos. Más adelante se unirán
al proyecto otros países.
El formato que se se diseña, denominado "MARC", pasa a ser
un standard ANSI en 1971 y sirve de base para elaborar en 1973
la primera versión de ISO 2709. Esta norma ISO especifica sólo
de forma mínima los elementos requeridos para un formato de
intercambio general de descripciones de documentos de todo tipo.
No precisa ni el tamaño ni el contenido de los distintos campos
ni atribuye ningôn valor a las etiquetas, ni a los indicadores
ni a los identificadores. Ofrece una estructura general, un
marco destinado específicamente a facilitar la transferencia de
datos entre sistemas de tratamiento de la información y no se
ocupa de cómo debe ser la explotación de esos sistemas.
ISO 2709 presenta una serie de características por las que
sin duda puede considerarse como uno de los más flexibles tipos
de estructuras para sistemas de gestión de bases de datos. Cada
registro ajustado a la norma contiene una cabecera y un
directorio dentro del propio registro. Este es uno de sus
principales aciertos. El sistema aseguraa que, en principio,
cualquier referencia documental pueda ser encajada dentro de la
estructura. Es posible modelar la noticia de maneras muy
distintas, pero en cualquier caso queda garantizado el
entendimiento comôn entre gestores de referencias, con
independencia del soporte que se utilice para el intercambio de
información.
En algunas ocasiones se ha considerado que la norma puede
ser ineficaz por su carácter genërico, pues no deja especificado
el sistema de códigos ni el contenido mismo de la información
que debe incluir cada campo. Se ha dicho que es una norma
demasiado amplia para el intercambio de información
bibliográfica. Sin embargo, el carácter abierto de la norma
constituye, probablemente, uno de los aspectos más positivos de
ISO 2709. Así, puede ser utilizada como marco para realizar, al
menos en teoría, cualquier tipo de intercambio de descripciones
documentales. Es un marco, un standard para el transporte de
información, no un formato de uso interno preceptivo en los
sistemas de automatización bibliotecaria.
De hecho, a lo largo de la dëcada de los setenta van
surgiendo distintas versiones nacionales MARC: en Francia,
Canadá, Reino Unido, etc. Es decir, aparecen variantes locales,
para poder incorporar informaciones segôn usos locales. Aunque
todasse ajustan a ISO 2709. Estos nuevos formatos van
diferenciándose mucho entre sí. Para intentar arreglar la
situación intervino la IFLA (International Federation of Library
Associations and Institutions) en 1977 aprobando la primera
versión de lo que se denominará formato UNIMARC (Universal MARC
format).
Era necesario establecer un standard que determinara la
normalización de los contenidos y de los indicadores de
contenido que se iban a usar en el intercambio entre las
agencias bibliográficas. Los formatos de ámbito local se
caracterizaban por una gran falta de uniformidad. Existía, por
ejemplo, carencia de acuerdo internacional sobre la organización
del contenido en los registros y sobre la función de los
indicadores de contenido. Las particularidades específicas
obstaculizaba notablemente la posibilidad de intercambiar
informaciones entre distintos sistemas. UNIMARC se estructuró de
forma algo distinta a la propia de las versiones nacionales MARC
que se desarrollaron en los años setenta, tratando de llegar a
ser un modelo "universal" no sólo en sentido geográfico sino
tambiën en sentido documental.
Desarrollado el formato UNIMARC, IFLA concibe como
desideratum que cada país siga utilizando su propio modelo de
registro local para uso propio, pero que las agencias
bibliográficas nacionales se encarguen de realizar la conversión
de los datos en formato nacional a formato UNIMARC y el proceso
inverso cuando se deba entablar intercambio de información
bibliográfica. Un comitë permanente quedó encargado de estudiar
los problemas tëcnicos, jurídicos y financieros inherentes a la
interconexión de las bases de datos nacionales.
De esta forma observamos un proceso, que tiene su gestación
y diversificación en desarrollos locales de instituciones
concretas. Luego la historia ha mostrado cómo es necesaria la
armonización normativa a nivel internacional para intentar que
se conserve como norma lo que no conseguía serlo.
CONCLUSION
Esperamos que este caso histórico, así como las
consideraciones que hemos intentado presentar haya servido para
adquirir conciencia de la necesidad de normalización de formatos
para el intercambio. Así mismo deseamos que a la hora de
desarrollar los correspondientes standards, los profesionales y
los distintos organismos de normalización consigan llevar a cabo
su tarea con ëxito.
Descargar