LA NORMALIZACION DE FORMATOS PARA EL INTERCAMBIO DE INFORMACION EN SOPORTE LEGIBLE POR MAQUINA Moya, F.; Hípola, P. «Format Standardisation for the exchange of machine readable information». En: Informatique et Libertés. Poitiers (Francia) 1989. Félix de Moya, Pedro Hípola E. U. de Biblioteconomía y Documentación Universidad de Granada (España) INTRODUCCION A lo largo de este seminario se están analizando diversos problemas relacionados con la regulación jurídica de la información que se procesa por medio de sistemas informáticos. Para abordar adecuadamente este asunto es necesario asumir cuáles son las características de un conjunto de herramientas básicas. Así, por ejemplo, es imprescindible considerar nociones como la de fichero informático, carácter, protocolo, cuáles son los distintos tipos de ficheros, de bases de datos, etc. Las tëcnicas no sólo de la informática, sino tambiën otras tëcnicas usuales en telecomunicaciones sobre todo los procesos "telemáticos". Una vez delimitadas estas nociones elementales, cabe plantearse cuestiones cruciales como la regulación de cuáles pueden ser las informaciones susceptibles de ser incluidas en tales ficheros informáticos. El problema cobra particular importancia cuando se trata de ficheros que se pueden considerar, por algôn motivo, ficheros "pôblicos". La regulación del acceso a esta información registrada en soporte legible por máquina puede afectar directamente a derechos de los ciudadanos, de las instituciones, sociedades privadas, etc.; en ôltima instancia a la libertad de los hombres. Sin duda todas estas cuestiones están siendo abordadas por juristas especializados en este ámbito. En nuestra presentación, sin embargo, se va a tratar otra temática, algo diferente, pero estrechamente relacionada con los problemas que se acaban de citar. Se pretende ofrecer una exposición sobre algunos condicionantes que aparecen cuando se desea llevar a cabo el intercambio de información entre dos o más ordenadores. Existe una tendencia a pensar que los actuales sistemas telemáticos en funcionamiento son capaces, entre otras cosas, de intercambiar fácilmente entre sí todo tipo de informaciones. Lo cual sería una fuente añadida de peligros de desprotección para los ciudadanos: vulneración del derecho a una cierta intimidad, posibles abusos por parte de las personas y/o instituciones que controlan las informaciones legítimamente. O, peor aôn, uso ilegítimo por parte de quien pueda apropiarse indebidamente de los datos almacenados en algôn soporte informático. Este planteamiento, que ciertamente es acertado en muchos de sus aspectos, sin embargo no puede ser completamente sostenido hoy día. Y ello es debido a que, en contra de lo que gran parte del pôblico tiende a pensar, no existe tanta facilidad de comunicación entre los diversos sistemas existentes en el mercado. O, al menos, la posibilidad de intercambiar informaciones no se puede llevar a cabo todavía de una forma tan "transparente" como para que la transferencia favorezca suficientemente la gestión de los datos que se reciben. Existen diversos niveles de incompatibilidad que obstaculizan los procesos de intercambio. Consiguientemente nos encontramos con una serie de limitaciones, que en este caso van a afectar a las personas e instituciones que se encarguen de gestionar las distintas bases de datos. En este seminario probablemente se resaltará la necesidad de una adaptación del derecho, que garantice las libertades fundamentales de las personas físicas o jurídicas. En algunos casos será necesario limitar los tipos de informaciones que se puedan procesar. En otras ocasiones habrá que prohibir a determinados ciudadanos el acceso a ciertas informaciones. Pero, junto con todo esto, debemos indudablemente asumir una realidad: necesitamos cada día más poder disponer de informaciones almacenadas en soportes informáticos. Y además necesitaremos disponer de ellas para que puedan llevarse a cabo intercambios de datos, textos, etc., entre ordenadores de distintas personas e instituciones. Cada vez serán más las informaciones que se gestionen de manera mecanizada, por evidentes motivos de eficacia y rapidez en la gestión. Intentar defender una postura contraria a esta realidad sería, a nuestro juicio, un despropósito. Por tanto, limitando lo que haya que limitar, hay que trabajar para establecer modos de operar que permitan superar estos niveles de incompatibilidad a los que nos acabamos de referir. Una buena parte de los problemas que habrá que superar son cuestiones tëcnicas que conciernen ônicamente a especialistas en informática, fabricantes de sistemas, asociaciones de usuarios de software, hardware y telecomunicaciones... Pero existe otro conjunto de requerimientos que han de ser abordados por personal especializado en temas jurídicos. Entre ëstos un lugar primordial corresponde a la necesidad de normalizar formatos de documentos para el intercambio de información en soporte legible por máquina. Sobre esta cuestión nos centraremos ahora. LA NECESIDAD DE NORMALIZAR Tratemos de identificar, en primer lugar, por quë es necesario normalizar los formatos. Es un hecho por todos conocido el constante aumento de la demanda, y sobre todo de la oferta, de informaciones registradas en soportes informáticos. Es algo relacionado con el crecimiento del llamado "mercado de la información electrónica". Estas informaciones en muchos casos pueden servir para satisfacer las necesidades de usuarios dispersos geográficamente. El modo de proporcionárselas puede estar basado en uno de estos dos procedimientos de gestión de datos: 1.explotación online de la oferta disponible, y 2.intercambio de información entre los sistemas existentes. El primero de los mëtodos citados presenta ciertamente ventajas considerables, como por ejemplo la posibilidad de acceder a información constantemente actualizada. Sin embargo, tambiën hay que asegurarse de que se cumplen algunas exigencias indispensables para que el sistema sea suficientemente eficaz, fiable, de rápida respuesta, etc. Se requiere, por una parte, un nômero de líneas de telecomunicaciones disponibles tanto mayor cuanto mayor es el conjunto de usuarios que han de acceder a los ficheros existentes. El inconveniente fundamental de este requerimiento es de índole económica: los costos de instalar y explotar la infraestructura tecnológica necesaria. Además, hay que recordar que esta infraestructura no funciona en todas partes de una forma lo suficientemente adecuada. En lo que a Europa se refiere podemos traer a la memoria la estadística publicada no hace mucho por EUSIDIC (European Association of Information Centers). Las cifras que se dieron a conocer pusieron de manifiesto el estado de la cuestión, que se puede considerar algo precario en lo que se refiere al funcionamiento de la red especial de transmisión de datos por conmutación de paquetes dentro de los países miembros de la Comunidad Europea. La explotación online requiere, por otra parte, la utilización de una serie de recursos software. Estos se han de encargar de gestionar los procesos a los que las informaciones van a ser sometidas para satisfacer las necesidades de los usuarios. En la medida en que el nômero de usuarios sea mayor, evidentemente el tipo de necesidades aumenta, y además se diversifica. Consiguientemente, se multiplica la variedad de procesos, de vías de acceso a las bases de datos, de formatos de presentación de la información y de un gran conjunto de planificaciones necesarias para ofrecer las prestaciones que se le van a exigir al sistema. En definitiva, se trataría de desarrollar un completo software de recuperación de información con una considerable versatilidad. Esto tambiën es costoso En contraposición a la explotación online, deseamos aquí exponer las características de un mëtodo de trabajo orientado al intercambio de información. La tendencia propia de este modo de trabajo es operar de forma que se pueda garantizar en todo momento que en el intercambio de datos no se produzcan ni përdidas ni distorsiones. Actuar habitualmente de este modo ofrece, entre otras, las siguientes ventajas: A.reducción de costos, ya que los principales procesos se verifican a nivel local; B.resulta más factible adaptar las "performances" de la recuperación de información a los usuarios, por el mismo motivo. Se pueden respetar así distintas idiosincrasias de diferentes usuarios. Un modo de operar que reôna estas características debe estarbasado en un consistente sistema de normalizaciones: normalización de soportes, y normalización de formatos. En lo que a los soportes se refiere, cualquier tipo de información textual, sonora, gráfica, audiovisual puede hoy día ser almacenada en soportes normalizados controlables por ordenador. Estos standards han sido desarrollados por fabricantes de amplia presencia en el mercado de la tecnología o por organismos de normalización nacionales o internacionales. Por el contrario, resulta más difícil encontrar normas de formatos standard para albergar la información. Y aquí, al decir información nos referimos al sentido más propio de la palabra. No a meras "señales" transmitidas por dispositivos, sino a "datos" dotados de una carga "semánticoconceptual". A nuestro juicio el problema fundamental para garantizar la operatividad de un "modus operandi" dirigido al intercambio de información en soportes legibles por máquina es que los organismos internacionales definan las características fundamentales de formatos standard para albergar los diversos tipos de informaciones contenidas en la documentación que se desea procesar. Parece deseable alcanzar al menos un nivel de normalización similar al existente en el ámbito de los soportes. COMO LLEVAR A CABO LA NORMALIZACION Si estamos de acuerdo en la necesidad de la normalización de formatos segôn el planteamiento precedente, podríamos formularnos algunas preguntas: ¿quiën puede tener autoridad para aprobar normas de este tipo? ¿Cuál es la situación actual a nivel internacional en estos asuntos? ¿Quë intereses se podrían hayar involucrados en un proyecto de tales características? Evidentemente, sea cual sea el planteamiento que nos hagamos, concluiremos que es necesario articular líneas de actuación de carácter eminentemente político. Existen organismos nacionales de normalización, como AFNOR (Association Française de Normalisation) en Francia, UNI (Ente Nazionale Italiano di Unificazione) en Italia, BSI (British Standards Institution) en el Reino Unido, DIN (Deutsches Institut für Normung) en la RFA, AENOR (Asociación Española de Normalización) en España, etc. Por otra parte, contamos con organismos de ámbito regional, como el CEN (Comitë Europeen de Normalisation). Y, por ôltimo, organismos de alto alcance internacional. A la cabeza está ISO (International Standards Organization). Si deseamos ser exhaustivos habría que añadir los organismos internacionales de normalización de carácter sectorial que podrían estar relacionados, al menos remotamente, con el tema. Ciñëndonos exclusivamente al ámbito europeo, se podrían citar, por ejemplo, ETSI (European Telecomunication Standards Institute) o CEPT (Conferencia Europea de Correos y Telecomunicaciones). Sería muy de agradecer que las relaciones entre todos estos organismos y otros que ahora omitimos se formulara de maneraclara; que se garantizara, en la medida de lo posible, la compatibilidad recíproca de las normas elaboradas por los diferentes organismos. Sabido es que ësta no es precisamente la tendencia habitual de los organismos nacionales. Por otra parte, tambiën nos parece deseable que en el ámbito de la Comunidad Europea se cuente con unas disposiciones legales lo suficientemente precisas sobre organismos de normalización, evitándose, por ejemplo, la duplicación de trabajos. Quizá se podría citar como el caso más problemático en la actualidad la falta de compatibilidad entre ciertas normas proclamadas por ISO y los organismos de normalización de USA y Japón. Los mayores productores del mundo en el área de la informática y de las telecomunicaciones a menudo se basan, para fabricar sus productos, en standards no compatibles con normas ISO. Por citar un ejemplo conocido, nos podríamos referir a lo difícil que resulta encontrar terminales de caracteres de 8 bits ajustados a la normativa ISO. Sin embargo, resulta muy fácil adquirir terminales ASCII (American Standard Code for Information Interchange), standard americano. En lo que se refiere a productos hardware y software siempre nos estamos encontrando con intereses comerciales, frecuentemente enfrentados con la compatibilidad de sistemas. Pero quizá resultaría viable instar a los fabricantes a que armonicen su oferta de acuerdo con un formato de registro para el intercambio de información documental. Tal norma serviría de intermediario entre distintos sistemas de información. Los diseñadores particulares podrían mantener sus propias especificidades. Simultáneamente deberían aceptar esa arquitectura universal de formato de intercambio. El proyecto debería ser fuertemente respaldado por los organismos nacionales e internacionales de normalización. La Comunidad Europea ha impulsado proyectos interesantes como el del CCF (Common Communication Format) y FORMEX (FORMalized Exchange of electronic publications). Si se continôa en esta dirección, teniendo en cuenta la relevancia que el conjunto de países miembros puede tener, quizá en un plazo relativamente breve podría contribuir a que arraigue el formato. CARACTERISTICAS DEL FORMATO Siguiendo un modo de proceder ya utilizado en otros standards, el proyecto de formato debería desarrollarse a dos niveles: 1.nivel físico, y 2.nivel lógico. Dentro del nivel físico, sería necesario, en primer lugar, definir los elementos que permitan identificar la estructura de dicho formato. No se debe definir una estructura sin antes definir los elementos que van a identificar las partes de esa estructura. En el segundo de los niveles se trataría de definir estructuras lógicas independientes para cada tipo documental que se va a albergar en los registros. Así, por ejemplo, haría falta una caracterización lógica para registros con informaciones penales, otra para registros de la propiedad inmobiliaria, etc. Existen distintas tipologías documentales administrativas en los sistemas manuales que ahora se emplean. Es posible utilizar dichas tipologías como base para diseñar los diversos formatos lógicos que se usarán en los registros informáticos. La estructura debe ser capaz de facilitar la transferencia de informaciones de todo tipo: información estructurada: como, por ejemplo, informaciones factuales, cifras, datos codificados; e información "desestructurada": cualquier tipo de información que no estë formalmente estructurada, como, por ejemplo, textos redactados en lenguaje natural libre. Así se conseguiría que información desestructurada adquiera una estructura que la haga manejable por un sistema informático. Además, debe ser posible la integración de gráficos, registros sonoros y audiovisuales. Interesaría aprovechar los beneficios que va a aportar la Red Digital de Servicios Integrados (RDSI), de cara a integrar, dentro de los mismos soportes, información de procedencia digital o analógica información analógica digitalizada. Los proyectos EDI Llegados a este punto, podríamos traer a colación la existencia de una serie de standards de transferencia de documentos en soporte legible por máquina. Han sido desarrollados en algunos casos por fabricantes de amplia presencia en el mercado informático. En otras ocasiones los han elaborado organismos internacionales de normalización. Son los proyectos EDI (Electronic Data Interchange). Se trata en la mayor parte de las ocasiones de arquitecturas que se desenvuelven sobre todo en el plano, por así decirlo, de la "informaciónseñal". Su predecesor son las normas para preformateo de documentos de IBM. Entre los standards más prestigiosos se encuentra la norma X400, elaborada dentro del ámbito del CCITT (Comitë Consultivo Internacional sobre Telegrafía y Telefonía). Se trata de un modelo teórico de comunicación de mensajes. Está diseñado para permitir la interconexión de servicios de mensajes de orígenes diversos. La norma se publicó en 1984 y ha sido revisada en 1988. Por otra parte está EDIFACT, lenguaje normalizado para el intercambio electrónico de datos a nivel internacional dentro del ámbito de la Administración, el comercio y el transporte. Está fomrmado por un conjunto de reglas de sintaxis al nivel de aplicación de OSI (Open Systems Interconnection). El standard ha surgido principalmente a partir de los trabajos del comitë inglës Sitpro (Simplification of International Trade Procedures Board),de Sitprofrance (Comitë Français pour la Simplification des Procedures du Commerce International) y de ANSI (American National Standards Institute). Ha sido aceptado por CEE/ONU (Commision Économique pour l'Europe des Nations Unies). Tambiën ha sido recientemente adoptado como norma por ISO (ISO 9735). Desarrollados a partir de EDIFACT, se han preparado propuestas de normas de mensajes para el intercambio de "pedidos" y de "avisos de envío". Tambiën es importante mencionar la propuesta ISO/DIS 8613. Su aprobación como norma del JTC1 (Joint Technical Committee), comitë mixto ISO/IEC (IEC= International Electrotechnical Commission) estaba prevista para diciembre de 1988. ISO 8613 será una norma de representación de documentos concebida para la transmisión electrónica. Es conocida como ODA/ODIF (Office Document Architecture/Office Document Interchange Format). La arquitectura incluye definición lógica de páginas, cuadros... Tambiën está prevista la integración de textos y gráficos. Citemos, por ôltimo, FORMEX (FORMalized Exchange of electronic publications), norma para el almacenamiento de información textual informatizada, preparada para posibilitar el intercambio entre autores, editores y hosts. Está integrada por la definición de caracteres (ISO 646, ISO2022 e ISO 6937) y por las especificaciones de tratamiento de datos, basadas en ISO 2709, CCF e ISO 8879 (Standard Generalized Markup Language/SGML). Nosotros, por nuestra parte, hemos de insistir en una idea que ya hemos apuntado. En esta presentación se desea proponer la implementación de formatos standard para albergar la información documental en sí misma, esto es, datos dotados de una carga "semánticoconceptual", no meras "señales" que se transmiten. Desde esta perspectiva se podría afirmar que los proyectos EDI citados articulan más bien especificaciones para estructurar "señales" contenidas en formato de documento. O, como mucho, contemplan definiciones lógicas que ofrecen la posibilidad de transmitir documentos con información muy estructurada (como es el caso, por ejemplo, de los "pedidos"). Además hay que añadir que, con ser normas muy ôtiles, a veces son incompatibles con formatos ya existentes y de amplio uso. En este sentido queda mucho terreno por avanzar. El caso MARC Al afrontar el desarrollo del proyecto que proponemos, sería recomendable evitar algunos errores como los que se han cometido al elaborar ciertas normas. Querríamos exponer aquí un caso que consideramos aleccionador, por sus aspectos positivos y por algôn aspecto menos afortunado. Se trata de una arquitectura de formato que se utiliza en un determinado contexto profesional. No está relacionada directamente con la información de tema jurídico, pero el planteamiento seguido para determinar las especificaciones físicas y lógicas del formato puede ser en gran medidaextrapolable a gran parte de los ambientes en los que se ha de llevar a cabo una gestión documental. En el ámbito de la Documentación contamos con una norma, ISO 2709, que regula la disposición de los datos en soporte informático para el intercambio de información bibliográfica. Analizando la norma y la historia de su gestación y uso, se pueden extraer algunas conclusiones interesantes. Sus orígenes se remontan al final de la dëcada de los 50, cuando comienzan en la Library of Congress de USA los primeros estudios sobre la la posibilidad de automatizar algunas funciones. Es el inicio del proyecto MARC (Machine Readable Cataloguing). Como participantes en el proyecto son seleccionados inicialmente una serie de centros bibliotecarios norteamericanos. Más adelante se unirán al proyecto otros países. El formato que se se diseña, denominado "MARC", pasa a ser un standard ANSI en 1971 y sirve de base para elaborar en 1973 la primera versión de ISO 2709. Esta norma ISO especifica sólo de forma mínima los elementos requeridos para un formato de intercambio general de descripciones de documentos de todo tipo. No precisa ni el tamaño ni el contenido de los distintos campos ni atribuye ningôn valor a las etiquetas, ni a los indicadores ni a los identificadores. Ofrece una estructura general, un marco destinado específicamente a facilitar la transferencia de datos entre sistemas de tratamiento de la información y no se ocupa de cómo debe ser la explotación de esos sistemas. ISO 2709 presenta una serie de características por las que sin duda puede considerarse como uno de los más flexibles tipos de estructuras para sistemas de gestión de bases de datos. Cada registro ajustado a la norma contiene una cabecera y un directorio dentro del propio registro. Este es uno de sus principales aciertos. El sistema aseguraa que, en principio, cualquier referencia documental pueda ser encajada dentro de la estructura. Es posible modelar la noticia de maneras muy distintas, pero en cualquier caso queda garantizado el entendimiento comôn entre gestores de referencias, con independencia del soporte que se utilice para el intercambio de información. En algunas ocasiones se ha considerado que la norma puede ser ineficaz por su carácter genërico, pues no deja especificado el sistema de códigos ni el contenido mismo de la información que debe incluir cada campo. Se ha dicho que es una norma demasiado amplia para el intercambio de información bibliográfica. Sin embargo, el carácter abierto de la norma constituye, probablemente, uno de los aspectos más positivos de ISO 2709. Así, puede ser utilizada como marco para realizar, al menos en teoría, cualquier tipo de intercambio de descripciones documentales. Es un marco, un standard para el transporte de información, no un formato de uso interno preceptivo en los sistemas de automatización bibliotecaria. De hecho, a lo largo de la dëcada de los setenta van surgiendo distintas versiones nacionales MARC: en Francia, Canadá, Reino Unido, etc. Es decir, aparecen variantes locales, para poder incorporar informaciones segôn usos locales. Aunque todasse ajustan a ISO 2709. Estos nuevos formatos van diferenciándose mucho entre sí. Para intentar arreglar la situación intervino la IFLA (International Federation of Library Associations and Institutions) en 1977 aprobando la primera versión de lo que se denominará formato UNIMARC (Universal MARC format). Era necesario establecer un standard que determinara la normalización de los contenidos y de los indicadores de contenido que se iban a usar en el intercambio entre las agencias bibliográficas. Los formatos de ámbito local se caracterizaban por una gran falta de uniformidad. Existía, por ejemplo, carencia de acuerdo internacional sobre la organización del contenido en los registros y sobre la función de los indicadores de contenido. Las particularidades específicas obstaculizaba notablemente la posibilidad de intercambiar informaciones entre distintos sistemas. UNIMARC se estructuró de forma algo distinta a la propia de las versiones nacionales MARC que se desarrollaron en los años setenta, tratando de llegar a ser un modelo "universal" no sólo en sentido geográfico sino tambiën en sentido documental. Desarrollado el formato UNIMARC, IFLA concibe como desideratum que cada país siga utilizando su propio modelo de registro local para uso propio, pero que las agencias bibliográficas nacionales se encarguen de realizar la conversión de los datos en formato nacional a formato UNIMARC y el proceso inverso cuando se deba entablar intercambio de información bibliográfica. Un comitë permanente quedó encargado de estudiar los problemas tëcnicos, jurídicos y financieros inherentes a la interconexión de las bases de datos nacionales. De esta forma observamos un proceso, que tiene su gestación y diversificación en desarrollos locales de instituciones concretas. Luego la historia ha mostrado cómo es necesaria la armonización normativa a nivel internacional para intentar que se conserve como norma lo que no conseguía serlo. CONCLUSION Esperamos que este caso histórico, así como las consideraciones que hemos intentado presentar haya servido para adquirir conciencia de la necesidad de normalización de formatos para el intercambio. Así mismo deseamos que a la hora de desarrollar los correspondientes standards, los profesionales y los distintos organismos de normalización consigan llevar a cabo su tarea con ëxito.