EL MODELO DE DATOS RASTER El modelo de datos raster, como señala Bosque (1992), es el modelo de datos complementario al modelo vectorial presentado anteriormente. Tiene como principal característica el llevar a cabo una representación “discreta” del mundo real, empleando una malla de rejillas regulares que denominaremos celdillas o píxeles. Para cada celdilla se almacena un valor numérico que representa el valor de un determinado aspecto del mundo real en el interior de dicha celdilla. Malla raster. En cada una de las celdillas o píxeles se almacenan valores de un determinado aspecto o variable del mundo real. Generalmente, cada capa raster almacena en sus celdillas valores de un único aspecto del mundo real: usos del suelo, temperatura, pendiente, precio del suelo, carreteras, red hidrográfica… de tal forma que cada aspecto o variable de la realidad sería representado por una capa raster. El valor numérico almacenado tiene Para el caso de las variables cualitativas como por ejemplo los usos del suelo, se almacenaría en cada celdilla un código numérico que representaría el tipo de uso existente en dicha celdilla. CÓDIGO NUMÉRICO 1 2 3 4 5 TIPO DE USO Olivar Matorral Regadío Caducifolios Zonas urbanas Tabla 1.Equivalencia de códigos numéricos y tipos de uso del suelo para una variable cualitativa Para el caso de las variables cuantitativas, como por ejemplo el caso de las pendientes, el número que se almacenaría se correspondería con el valor de la variable en esa celda. Otra de las principales característica del modelo “raster”, es que registra el interior de los objetos en lugar de codificar sus fronteras, de tal forma que los límites quedan implícitamente representados por los límites de las celdillas que presentan un mismo valor. Siguiendo con el ejemplo de los usos del suelo, podemos observar en la figura 1, que tras superponer la malla raster y codificar los elementos existentes en el interior de cada píxel, obtenemos la imagen de la figura 2, en la que los límites de los usos del suelo quedan delimitados de forma implícita por los bordes de las celdillas, y de ahí su aspecto, que comúnmente denominamos “pixelado”. Figura 1. Malla raster y usos del suelo Figura 2. Codificación raster de los usos del suelo Esta característica del modelo raster permite representar mejor las variables continuas (elevaciones, precipitación, precio del suelo…), que varían de forma gradual en el espacio (figura 3 izqda) y en las que no existen unos límites bien diferenciados de las diferentes entidades espaciales. Para poder representar variables de este tipo en el modelo vectorial sería necesario agrupar los rangos de valores en intervalos (fig 3 dcha). Figura 3. Representación raster de una variable continua (elevaciones) y agrupación en intervalos (discretización) de una variable continua para su representación vectorial. CARACTERÍSTICAS DE LAS CELDILLAS RASTER Hemos introducido brevemente algunas de las características generales del modelo raster, entre las cuales señalábamos a las celdillas o píxeles como los elementos fundamentales del modelo, de las misma forma que en el modelo vectorial lo eran los puntos, las líneas y los polígonos. A continuación presentamos algunas de las principales características de las celdillas que consideramos importantes para un mejor conocimiento de este modelo de datos: • Regulares: Las celdillas son regulares, es decir todas son iguales, estableciendo una codificación discreta de las coordenadas. La celdilla es la unidad mínima en un archivo raster, y por ello el tamaño de celda nos dará la precisión con que podremos definir los elementos geográficos. • Localizables por su número de fila y columna. Cada celda puede ser identificada por su posición en la matriz del archivo raster, a partir de su número de fila y columna. • Contienen un valor numérico que puede ser el identificador de la celda o el valor temático de la misma (elevaciones, temperatura, etc), de tal forma que la geometría y la componente temática se almacenan a la vez. PÉRDIDA DE INFORMACIÓN, RESOLUCIÓN Y REGLAS DE CODIFICACIÓN. Como podíamos observar en la figura 1 y 2 la codificación raster de la información supone una pérdida de la misma con respecto a la realidad, debido a que este modelo supone una simplificación del mundo real. A continuación señalamos los dos aspectos que fundamentalmente suponen las fuentes de pérdida de información en el modelo raster: 1. En primer lugar, al no codificar la frontera de las entidades espaciales, únicamente podremos tener límites en los bordes de los píxeles, lo que supone una pérdida de precisión en la definición de estas entidades. Esta pérdida de precisión estará en relación con la resolución del píxel, entendida ésta como la longitud del lado de las celdillas, de tal forma que a mayor longitud del lado, menor resolución. Parece obvio señalar que una mayor resolución posibilitará una mayor precisión de la capa raster, con lo que igualmente habría una menor pérdida de información. Sin embargo la alta resolución tiene una contrapartida, y es el mayor tamaño de los ficheros raster, puesto que el número de celdas necesarias crece de manera elevada. 2. En segundo lugar, encontramos el hecho de que en cada una de las celdillas solamente podemos almacenar el un valor de la variable, aunque en muchas de ellas coexistan zonas con diferentes valores. Generalmente se suele aplicar la regla de codificación del 50 %, que asigna a un píxel el valor de aquella categoría que presente más del 50 % de la superficie del píxel. Igualmente también es posible aplicar la codificación de presencia/ausencia, especialmente cuando se trata de capas binarias (en las que únicamente distinguimos si se da o no un fenómeno), que asigna al píxel el valor de una entidad siempre que ésta esté presente, aunque sea de forma mínima. ESTRUCTURAS DE DATOS Dentro de esta representación de la realidad “raster” que hemos tratado de relatar brevemente, existen varias estructuras de datos, que representan la forma en la que se almacenan en el ordenador los valores registrados en cada una de las celdillas. Generalmente los SIG raster almacenan la información de cada capa en mínimo dos ficheros: el fichero de valores y el fichero de documentación (Puebla y Gould, 1994), este último en el que se señala la resolución del raster, número de filas y columnas, etc. Los dos tipos de estructuras más importantes las denominadas estructuras de datos simples y las estructuras de datos jerárquicas o en árbol (QUAD TREE). Dentro de las estructuras raster simples podemos distinguir igualmente la estructura raster de “codificación exhaustiva” y la de “codificación run-lenght”. No entraremos a explicar cada una de ellas de forma exhaustiva, sino que únicamente pretendemos presentar las diferentes posibilidades existentes. En cualquier caso, una descripción detallada de las mismas se puede encontrar en Bosque (1992) y Puebla y Gould (1994). SIG RASTER E IMÁGENES DE SATÉLITE Una característica muy importante de los SIG raster es el compartir el modelo de datos con las imágenes procedentes de los sensores satelitales. Dicho de otra forma, los datos aportados por los satélites, son datos raster. De hecho, los SIG y la teledetección, son técnicas que se han desarrollado de forma paralela, como señala Chuvieco (2002)1. De esta forma, las imágenes tomadas por los diferentes sensores remotos a bordo de satélites pueden ser perfectamente integradas en un SIG raster, como por ejemplo IDRISI, GRASS, etc. Generalmente se suelen incorporar al SIG los resultados de haber llevado a cabo un proceso de clasificación o de extracción de información temática de la imagen mediante técnicas de tratamiento propias de la teledetección. Así podríamos incorporar a nuestro SIG capas de información temática como cubiertas del suelo, índices de productividad vegetal, zonas afectadas por incendios, superficies cubiertas de agua,… que pueden generarse a través del tratamiento de estas imágenes de satélite. El potencial de la teledetección como fuente de información para los SIG es enorme como aquí se esboza, por lo que esta facilidad de integración entre la 1 CHUVIECO (2002): Teledetección Ambiental. La observación de la Tierra desde el espacio. Ariel, Barcelona. teledetección y los SIG raster debe ser tenida en cuenta como una posibilidad de obtención, tratamiento e integración de información territorial muy importante para la gestión del territorio, que sólo de una forma más dificultosa podríamos realizar empleando SIG vectoriales. VENTAJAS E INCONVENIENTES DE LOS MODELOS DE DATOS RASTER Y VECTORIAL Hemos presentado los dos modelos de datos que permiten representar en un SIG las entidades del mundo real, ya sea gracias a la codificación de sus límites (modelo vectorial) o del interior de los mismas (modelo raster). Estos modelos de datos presentan un conjunto de ventajas e inconvenientes el uno con respecto al otro, y puesto que, como señalábamos anteriormente, se trata de modelos complementarios, las ventajas de uno se convierten en los inconvenientes del otro. La tabla 2 trata de recoger de manera sintética las ventajas e inconvenientes de cada uno de ellos. VENTAJAS E INCOVENIENTES RASTER/VECTORIAL VENTAJAS RASTER VECTORIAL Estructura de datos muy simple Elevada precisión Facilidad para la representación de entidades espaciales Facilidad de integración con softwares CAD vectoriales. continuas Elevada capacidad para la superposición y combinación de Mapas de elevada calidad capas Capacidad para realizar análisis geostadísticos Capacidad para realizar análisis de redes Capacidad de integrar datos de satélite Estructuras de datos con topología Capacidad de incorporación de imágenes Ficheros de bajo tamaño INCONVENIENTES RASTER VECTORIAL Baja precisión (dependiendo del tamaño de píxel) Estructuras de datos complejas Dificultad de integración con CAD. Entorno de trabajo diferente al software CAD Dificultad para representar entidades espaciales continuas Mapas de menor calidad Menor capacidad para combinación de capas (especialmente aritmética) Incapacidad para realizar análisis de redes Incapacidad para realizar análisis estadísticos espaciales Estructuras de datos sin topología Dificultad para integrar datos de satélite Ficheros de elevado tamaño Incapacidad para el tratamiento de imágenes Tabla 2. Ventajas e inconvenientes de los modelos de datos raster y vectorial. PERO…¿RASTER O VECTORIAL…? Hemos presentado las ventajas e inconvenientes de cada uno de los modelos, pero probablemente nos sigamos preguntando aún: ¿qué debo elegir para la realización de un determinado proyecto, un software raster o uno vectorial? Probablemente esta pregunta no tenga una respuesta clara, sobre todo si no precisamos previamente la tarea para la cual queremos emplear nuestro software SIG. Así, podemos decir que determinadas tareas, análisis, operaciones de entrada de datos, etc, sería conveniente realizarlas con un SIG raster y otras con un SIG vectorial. Ahora bien, si tenemos en cuenta que los distintos softwares existentes, tanto comerciales como libres, presentan la posibilidad de operar con datos en formato raster y vectorial indistintamente, podríamos pensar que ya tenemos la solución a nuestra pregunta... aunque seguramente si indagamos un poco más y descubrimos que nuestro software se encuentra especializado en el tratamiento de un tipo de datos y que no presenta cierta herramienta de análisis propia del otro tipo, la solución a nuestra pregunta aparecería lejana… Por suerte, y cada vez más, como veremos más adelante cuando hagamos referencia a las Infraestructuras de datos espaciales, es posible realizar operaciones de análisis con un determinado software e importar los datos a otro para realizar con él otros análisis diferentes. De esta forma una combinación de un software raster y otro vectorial sea la clave para resolver todos los problemas que se nos planteen. Ahora sólo queda decidir qué tareas realizar en raster y cuáles en vectorial…quizás la tabla anterior pueda entonces darnos alguna de las respuestas que buscamos.