NOTAS CLASE SIG I CONTENIDO 1 INTRODUCCION ________________________________________________________3 2 BASES PARA LA REPRESENTACION _______________________________________3 2.1 Almacenamiento de datos en SIG _____________________________________________ 3 2.1.1 La relación entre el mundo real y los datos en un SIG __________________________________ 2.1.1.1 Almacenamiento de números en el computador _____________________________________ 2.1.1.2 Almacenamiento de caracteres en el computador____________________________________ 2.1.1.3 Bases para la representación de los atributos en SIG _________________________________ 2.1.2 Características de almacenamiento de datos dentro de los sistemas computarizados___________ 2.2 Georreferencia ____________________________________________________________ 9 2.2.1 Sistemas coordenados _________________________________________________________ 2.2.1.1 La Esfera Autálica __________________________________________________________ 2.2.1.2 El elipsoide ________________________________________________________________ 2.2.1.3 El Geoide (Geo, tierra; como)__________________________________________________ 2.2.2 El uso de las coordenadas Geográficas _____________________________________________ 2.2.2.1 Latitud. ___________________________________________________________________ 2.2.2.2 Longitud.__________________________________________________________________ 2.2.3 Los tipos de proyecciones cartográficas. ___________________________________________ 2.2.3.1 Distancia __________________________________________________________________ 2.2.3.2 Dirección__________________________________________________________________ 2.2.3.3 Area _____________________________________________________________________ 2.2.3.4 Factor de escala_____________________________________________________________ 2.2.3.5 Clasificación de las proyecciones según sus propiedades_____________________________ 2.2.3.6 Clasificación de proyecciones según su forma ____________________________________ 2.2.3.7 Clasificación según su aspecto _________________________________________________ 2.2.3.8 Proyección Conforme de Gauss Kruger.__________________________________________ 2.2.3.9 Proyección Universal Transversa de Mercator. ____________________________________ 3 3 5 7 8 8 10 11 11 12 12 13 13 14 14 15 15 15 15 15 16 16 17 MODELOS DE REPRESENTACION Y ESTRUCTURA DE DATOS ________________18 3.1 Formas básicas de modelamiento de datos ____________________________________ 18 3.1.1 Modelo vector________________________________________________________________ 3.1.1.1 Representación de objetos aislados______________________________________________ 3.1.1.2 Representación de objetos topológicos___________________________________________ 3.1.2 Modelo raster ________________________________________________________________ 3.1.3 Modelamiento con datos triangulados _____________________________________________ 3.2 18 19 20 21 22 Implementación de modelos de representación_________________________________ 22 3.2.1 Modelamiento de superficies ____________________________________________________ 3.2.1.1 Superficie raster ____________________________________________________________ 3.2.1.2 Líneas de contorno __________________________________________________________ 3.2.1.3 Redes irregulares trianguladas (TIN) ____________________________________________ 3.2.2 Modelamiento de imágenes o datos de muestras _____________________________________ 3.2.2.1 Conjuntos de datos raster _____________________________________________________ 3.2.3 Modelado de rasgos discretos ____________________________________________________ 3.2.3.1 Conjuntos de datos de rasgos __________________________________________________ 3.2.3.2 Asociaciones Rasgos, redes y topología __________________________________________ 3.2.3.3 Rasgos y Cartografía_________________________________________________________ 22 23 23 24 24 25 27 27 28 29 1 NOTAS CLASE SIG I 4 CONVERSION DE DOCUMENTOS EXISTENTES (DIGITALIZACION) ___________ 32 4.1 Calcado Vector ___________________________________________________________34 4.2 “Scaners” raster __________________________________________________________35 4.2.1 4.2.2 4.2.3 4.2.4 4.3 La corrección Diferencial _______________________________________________________ 38 La corrección en Tiempo Real ___________________________________________________ 38 Corrección Diferencial Postprocesada _____________________________________________ 39 4.4 imágenes de satélite. _______________________________________________________39 4.5 Archivos que ya se encuentren en formato digital (vector o raster). ________________39 TRANSFORMACION DE MEDICIONES POR DIGITALIZACION A COORDENADAS 39 5.1 Registro _________________________________________________________________39 5.1.1 Transformaciones entre coordenadas de los puntos de control y unidades de digitalización ____ 5.1.1.1 Transformación similar ______________________________________________________ 5.1.1.2 Transformación fina (“affine”)_________________________________________________ 5.1.1.3 Transformaciones más complejas_______________________________________________ 5.1.2 Errores en las transformaciones __________________________________________________ 6 40 40 40 41 41 5.2 Proyecciones______________________________________________________________41 5.3 Referencia a servicios Geodésicos ____________________________________________42 CALIDAD DE LOS DATOS _______________________________________________ 42 6.1 Verificación y control de calidad _____________________________________________43 6.1.1 6.1.2 7 36 36 37 37 Colección de datos de GPS __________________________________________________37 4.3.1 4.3.2 4.3.3 5 Consideraciones de la resolución: ________________________________________________ Escala y Exactitud ____________________________________________________________ Preparación del Mapa__________________________________________________________ Otras consideraciones__________________________________________________________ Edición de errores_____________________________________________________________ 43 Otras pruebas de calidad de datos ________________________________________________ 46 DESPUES DE LA DIGITALIZACION _______________________________________ 46 7.1 Generalización y cambio de escala. ___________________________________________46 7.1.1 7.1.2 7.2 Vinculando Atributos por geocodificación. _________________________________________ 47 Actualizaciones temporales y cambios_____________________________________________ 50 Otros tópicos importantes de la calidad de los datos _____________________________50 7.2.1 Elementos de la calidad de datos _________________________________________________ 7.2.2 Fuentes de error de la información Geográfica. ______________________________________ 7.2.3 Infraestructura colombiana de datos espaciales (ICDE)________________________________ 7.2.3.1 Estándares_________________________________________________________________ 2 51 52 53 54 NOTAS CLASE SIG I UNIDAD 4. REPRESENTACIONES 1 INTRODUCCION Las representaciones comprenden un símbolo actuando en el lugar de alguna entidad (elemento del mundo real). Un sistema de representación puede optar por suprimir algunos detalles del mundo para enfatizar otros. El más claro precedente para las representaciones geográficas envuelve los símbolos gráficos usados en mapas tradicionales. Un mapa pobla un espacio pequeño con la representación de un espacio grande, usando símbolos de mapas que están en el sitio de las cosas del mundo real. La representación directa del espacio facilita muchos tipos de procesos visuales, pero la transformación a un espacio más pequeño crea muchos dilemas. El simbolismo del mapa tradicional a menudo hace a un marco de medición ajustarse a los límites técnicos de la reproducción gráfica; en lugar de actuar como una representación flexible de la información geográfica, los símbolos llegan a ser confusos con la medición. Este legado aún influencia la comprensión de la Información Geográfica. Las representaciones digitales son menos directas, que los mapas, estructurando relaciones espaciales. Los símbolos digitales son extremadamente simples, pero a pesar de esa simplicidad, las representaciones digitales mejoran las altas capacidades de los mapas impresos. Este capítulo repasa los elementos primitivos usados para representar los datos geográficos y después describe los modelos de datos básicos y las estructuras de datos1 que organizan esas primitivas dentro de representaciones útiles. La parte final describe los diferentes pasos usados para convertir fuentes de datos a un SIG. 2 BASES PARA LA REPRESENTACION 2.1 Almacenamiento de datos en SIG2 Los computadores son la tecnología que permite el desarrollo de los SIG. Su papel consiste en almacenar y manipular datos. Entender los elementos de almacenamiento de datos en un computador permitirá al usuario de SIG, diseñar un almacenamiento óptimo para los diferentes tipos de datos. Para entender la naturaleza de los datos almacenados en cualquier SIG, dos tópicos son importantes: La relación entre los datos almacenados y el mundo real que ellos dibujan. Las características del almacenamiento de datos dentro de los sistemas computarizados 2.1.1 La relación entre el mundo real y los datos en un SIG El mundo real es infinitamente complejo y tal complejidad no puede ser dibujada o procesada dentro de los límites de un sistema de computación normal. Los SIG representan el mundo a través de objetos geométricos: puntos, líneas y áreas para el modelo vector y celdas para el modelo raster. Esto puede ser ó no una descripción exacta de la realidad. En particular el modelo de punto, línea y polígono utiliza objetos con la forma de sus bordes bien definida, lo cual no es frecuente encontrar en el mundo real, donde los límites entre elementos son difusos o transicionales. Por ejemplo los elementos como los humedales son usualmente dibujados en los mapas con bordes redondeados, a 1 Arreglo de las entidades de datos que permite la construcción de relaciones a través de las operaciones de software; implementación del modelo de datos 2 Tomado de: http://www.ncgia.ucsb.edu/education/curricula/giscc/units/u037/u037.html 3 NOTAS CLASE SIG I pesar de que ellos tienen bordes pobremente definidos en la realidad. Así mismo son almacenados en el SIG y estos son los datos que se emplean para llegar a la solución de problemas. Los datos en SIG dan una visión simplificada del mundo real. En un SIG los datos que representan el mundo real han sufrido alteración en por lo menos tres aspectos: Selección: En SIG los aspectos seleccionados del mundo real (los que se consideran son importantes) son incluidos en el modelo digital, Los otros aspectos no son considerados o no se les da la importancia que muchas veces tienen, pero ellos pueden llegar a ser de gran influencia para el problema que se está analizando. Los usos probables de los datos serán decisivos para determinar cuales elementos serán incluidos. El grupo responsable de la recolección de los datos tendrá la responsabilidad en un área particular y los datos serán seleccionados para este propósito. Los usos posteriores de los mismos datos pueden ser infructuosos, cuando los propósitos son diferentes a aquellos para los cuales se seleccionaron. Representación: Los objetos del mundo real, que son incluidos, deben estar representados por un objeto definido en el programa SIG. Esto hace que esta representación no sea fiel y que se pierdan detalles y espacialidad. Los objetos que están representados en un SIG tendrán bordes definidos, mientras que en la naturaleza muchos de ellos no presentan formas exactas que delimiten su ubicación en el espacio. El uso probable de los datos será nuevamente decisivo, para determinar la forma de representación. En cualquier caso la escala estará definiendo los detalles de la representación. Cuantificación: Los sistemas computacionales generalmente almacenan datos numéricos, lo cual obliga a asignar valores numéricos a las características del mundo real, que serán incluidas en el SIG. Un sistema de computador almacena valores únicos o discretos. Esto puede representar fielmente ó no la continuidad de los datos que existen en el mundo real. La naturaleza de los datos es importante, ya que diferentes tipos de operaciones matemáticas pueden ser realizadas con diferentes datos. Los valores numéricos pueden ser definidos con respecto a escalas de medición nominal, ordinal, de intervalo o razón. Bits: La unidad de procesamiento más pequeña se denomina bit (Binary digIT). Cada bit puede tener uno de dos valores. “On” (representado por el valor 1) y “off” (representado por el valor 0). Los bits son agrupados en conjuntos de ocho, los cuales se denominan bytes. Sistemas binarios: Los computadores usan un sistema binario para almacenar los números. En un sistema binario las únicas formas son 1 y 0. Los sistemas binarios son explicados mejor por comparación con el sistema decimal que es más familiar (un sistema decimal usa 10 formas). En un sistema decimal los dígitos 206 representan el 4 NOTAS CLASE SIG I número que está conformado por 2 porciones de 102 más 0 porciones de 101 más 6 porciones de 100. (Esto suma 206). En un sistema binario los dígitos 101 representan el número 5, el cual está conformado por una porción de 22, más 0 porciones de 21, más 1 porción de 20 . (22 es 4, 21 es 2, y 20 es 1, entonces el número es 4+1=5). La numeración de 1 hasta 10 en sistema decimal, llevada a sistema binario sería: 1, 10, 11, 100, 101, 110, 111, 1000, 1001, 1010. Bytes: Un byte de almacenamiento son 8 bits. 2.1.1.1 Almacenamiento de números en el computador La mayoría de computadores proveen los siguientes formatos para números: entero, de punto flotante y de doble precisión (Figura No. 1). Figura No. 1 Almacenamiento en el computador usando los niveles básicos (bits, bytes, palabras-entero, punto flotante y doble precisión) 5 NOTAS CLASE SIG I La forma en que los datos numéricos son almacenados en el computador depende de la arquitectura del computador, la cual a su vez depende del tipo de computador (personal o convencional) y su modelo. El número de bits que el computador usa como unidad básica de almacenamiento varía. Los siguientes son los tamaños que se pueden presentar: 16-bit(2-bytes) computadores personales (generación previa) 32-bit (4-bytes) computadores personales (generación actual) 64-bit (8-bytes) Ultima generación. En esta época la mayoría de computadores almacena los valores enteros y de punto flotante en 32 bits y los de doble precisión en 64 bits. Los números enteros son los que no tienen decimales. El número 255 es el límite para un almacenamiento de 8 bits, por que es el número binario 11111111 (ocho unos), esto equivale a: 1 (el cual es 2°), más 2 (el cual es 2¹), más 4 (2²), más 8 (2³), más 16, más 32, más 64, mas 128. Este es un rango de datos muy usado. Muchos de los datos en SIG caen en este rango. Por ejemplo: Las unidades geológicas, forestales o de suelos, casi nunca sobrepasan las 255 unidades, por eso son de tipo byte. Las imágenes de satélite también usan este tipo de almacenamiento (sus valores oscilan entre 0 y 255). Los datos enteros con valores mayores a 255, requieren más de un byte de almacenamiento para ser guardados en un sistema de computador. Los enteros de 32 bits pueden representar cualquier número entero de –2147483647 a 2147483648. Con números enteros los resultados de cualquier división que envuelve un residuo será truncado a el siguiente entero más bajo. En SIG los datos en coordenadas UTM tendrán decimales. En sistemas estos son llamados datos de punto flotante. El punto flotante usa una notación logarítmica con un exponente para establecer la magnitud y la mantisa, para el valor. Este formato provee cerca de seis dígitos decimales de mantisa, escalado sobre un rango mucho mayor (típicamente –1036 a 1036). La doble precisión provee cerca de 15 dígitos, esencialmente una forma extendida de punto flotante, pero el almacenamiento es el doble y la velocidad de los cálculos es más alta. La selección entre esos formatos tiene consecuencias en el manejo de la información geográfica. Los computadores almacenan números negativos usando un bit de signo. El signo es usualmente el bit de orden superior, que es el bit en la posición izquierda. Si este bit tiene valor de 1 es negativo el número, si tiene valor de cero, el número es positivo. El programa le indica al procesador del computador si el bit de orden superior tiene que ser tratado como un bit de signo o como parte del número. Excepto los datos byte, los números son usualmente almacenados como datos de signo. En general el almacenamiento de datos enteros tiene ventaja sobre los de punto flotante, pues los flotantes requieren más espacio de almacenamiento que los enteros, ya que necesitan almacenar dos números para un mismo valor. Así mismo los de punto flotante son más complejos para procesar. Al seleccionar un tipo de almacenamiento de datos los usuarios deben considerar el uso que se le quiere dar a los datos en SIG y el tipo de valores que requerirá para ser representado. 6 NOTAS CLASE SIG I 2.1.1.2 Almacenamiento de caracteres en el computador El grupo de letras (textos) o caracteres son usualmente llamados “strings”. Su almacenamiento se realiza de acuerdo con un sistema de codificación (por ejemplo códigos ASCII) Los archivos de texto, constituyen otro manejo importante de los bytes. Para almacenar textos se usa el sistema ASCII (American Standard Code for Information Interchange) de codificación.. Toda letra y número en un teclado tiene un único código. Siete bits son usados para dar 127 números de código, los cuales son asignados a cada tecla. (Las teclas en mayúscula y minúscula tienen diferentes códigos). Allí hay también códigos para los caracteres especiales como Tabulaciones y Enter. (Ver Tabla 1). Los 127 códigos ASCII básicos pueden ser extendidos usando 8 bit para dar un total de 255 códigos. Esos códigos “extra” incluyen caracteres internacionales. Actualmente el “16 bit caracter internacional” permite introducir los “kanji” y los caracteres chinos. Tabla 1 Códigos ASCII para varios caracteres del teclado Caracter (espacio) ! " # $ % & ' ( ) Código ASCII 32 33 34 35 36 37 38 39 40 41 Caracter 0 1 2 3 4 5 6 7 8 9 Código ASCII 48 49 50 51 52 53 54 55 56 57 Los códigos ASCII son un estándar muy importante para la transferencia de datos. La forma en que los datos numéricos son almacenados en un computador, depende de la arquitectura del computador. Los datos creados sobre un tipo de computador no podrán ser interpretados por un computador con diferente arquitectura. Los datos deben ser convertidos a ASCII antes de transferirlos de un computador a otro con diferente arquitectura, ya que todos los computadores interpretan correctamente los códigos ASCII. La mayoría de programas SIG ofrecen opciones de exportación de datos, que producen archivos ASCII. La desventaja de la codificación ASCII radica en que los archivos SIG son codificados de manera más extensa utilizando esta opción. Por ejemplo: el número 127 puede ser almacenado en formato binario en un byte (permite almacenar números de cero a 255); mientras que en formato ASCII, se requeriría de un byte para el uno, un byte para el 2 y un byte para el 7. Los números pueden ser almacenados como carácter. Un número así almacenado estará comprendido por una serie de caracteres. No es posible usar los números guardados como caracteres en operaciones matemáticas. Si un carácter incluye espacios, es necesario usar comilla (“ ó ‘) para indicar su extensión. 7 NOTAS CLASE SIG I 2.1.1.3 Bases para la representación de los atributos en SIG Los valores de atributo en un sistema digital son directamente codificados usando las unidades de almacenamiento del computador. La matriz geográfica cubre la estructura de datos de un arreglo bidimensional. Una localización de almacenamiento es asignada por cada valor de atributo. Los números son habitualmente codificados como puntos flotantes, porque seis dígitos son adecuados para la porción significativa de una medición de atributo. Los cálculos son habitualmente codificados como enteros para hacer uso del rango incrementado, aunque un entero de 32 bit no es tan adecuado para representar la suma de la población mundial. Cuando el volumen de almacenamiento se convierte en preocupación, como con las imágenes de satélite, las mediciones continuas deben ser reescaladas al rango de 0 a 255 y codificadas como un entero en un byte. Muchos usuarios olvidan ese detalle y simplemente tratan un atributo como un número. Ellos asumen que el computador puede manejar todas las operaciones aritméticas obvias. El computador manipula las unidades de almacenamiento sin reconocer niveles diferentes de medición, por lo tanto, lo válido de los cálculos depende del significado externo. Los atributos nominales deben ser codificados como un tipo de número también. Las reglas de codificación llegan a ser parte del esquema de la estructura de datos que debe ser preservado para retener el significado de la información. Las categorías pueden ser codificadas en un solo byte sin pérdida del contenido de la información, siempre y cuando haya solamente 256 posibilidades. Los diferentes tipos de almacenamiento posibles para los atributos se presentan en la Tabla 2 2.1.2 Características de almacenamiento de datos dentro de los sistemas computarizados La siguiente terminología es comúnmente usada para describir las capacidades de almacenamiento de varios dispositivos K – Kilobyte o aproximadamente 1000 bytes M – Megabytes o aproximadamente 1.000.000 de bytes G – Gigabyte o aproximadamente 1.000.000.000 bytes El diseño del SIG debe garantizar que la capacidad de almacenamiento sea usada eficientemente. La precisión espacial es importante en SIG, por eso existe tanta demanda por parte de los paquetes en cuanto al almacenamiento de datos espaciales . Para el almacenamiento de datos no espaciales como los valores de celdas en el modelo raster ó los códigos de los polígonos en el modelo vector, el diseño es importante y la mayoría de programas SIG son flexibles en cuanto a los tipos de almacenamiento de estos datos. El modelo raster para datos de SIG típicamente requiere más almacenamiento que el vector, debido al gran número de celdas que deben ser almacenadas, entonces los tópicos de diseño deben ser más cuidadosos para este modelo. El diseño del almacenamiento de datos es importante por dos razones: Los usuarios de SIG inevitablemente se encuentran con que cada vez los requerimientos para el almacenamiento de datos son mayores y su desarrollo se hace paralelo con el aumento de la capacidad de los dispositivos de almacenamiento. Por este motivo el uso eficiente del espacio 8 NOTAS CLASE SIG I disponible es esencial. Cuando los datos son procesados deben ser leídos desde el dispositivo de almacenamiento y después de procesados ser reescritos. Leer y escribir los datos es usualmente la parte más lenta del procesamiento de datos. Si un diseño pobre ha estipulado el uso de grandes cantidades de almacenamiento innecesarias, el tiempo de procesamiento será lento, por tenerse que leer y escribir bytes de almacenamiento redundante. Las características de diferentes tipos de almacenamiento de datos se presentan en la Tabla 2 Tabla 2 Resumen de tipos de almacenamiento de datos Tipo Byte3 Otros nombres Char 8-bit Entero No entero Numérico Decimal Flotante Doble precisión 7.5 3.14159 6 402 200 -10 310 3.2 Ejemplo (es muy grande, (No debe tener 6/2/1998 inválido(razón pasa de 255) valor decimal) (solo se de su no- 2.1 27m cifras) validez) (no debe tener (no debe haber valores decimales) caracteres) Ejemplos Carácter String “Río azul” Playas blancas (son requeridas permiten comillas con palabras que tienen espacios) En algunos software 4 byte (32 bits) es usado para almacenar datos enteros. Para el almacenamiento de datos no enteros es usado 8 byte (64 bits), por ejemplo para almacenar datos de coordenadas en algunos software vector. 2.2 Georreferencia La representación del espacio requiere un sistema de referencia espacial. En un mapa la localización es codificada por la posición relativa sobre el papel. En una base de datos computacional la localización está basada en la geometría analítica. Para propósitos prácticos el componente espacial de la información geográfica está representado en forma de coordenadas, ósea mediciones ordenadas dentro de un sistema de referencia espacial. Esas mediciones pueden ser ángulos en un elipsoide (latitud, longitud) o distancias ortogonales sobre un plano de proyección. Hay diferentes formas de codificar mediciones equivalentes, incluso sobre un mismo plano. Cada programa SIG implementará un cierto rango de sistemas de referencia espacial alternativos, como representaciones específicas de las posibilidades matemáticas. Todos los sistemas debido a que ellos pueden representar mayoría de líneas de números soportados por los computadores tienen una resolución limitada, son en esencia enteros. Cuando son usados para coordenadas, los enteros no todas las localizaciones intermedias entre líneas diagonales (Figura No. 2). La diagonales de un par de números enteros a otro par, pasan a través de 3 Los datos byte son usados frecuentemente para datos raster (especialmente en percepción Remota), pero raramente son usados para datos vector. 9 NOTAS CLASE SIG I localizaciones que no pueden ser representadas en el sistema entero, sin torcer los segmentos de línea recta. En la figura puede ser observado que las líneas oscuras representan el resultado de la intersección de dos líneas rectas una vez que han sido redondeadas a enteros las coordenadas. Para evitar esos problemas los sistemas de representación de coordenadas deben tener una excesiva resolución. El almacenamiento con enteros también produce que no haya representación de coordenadas que puedan ofrecer variaciones continuas verdaderas. El tamaño de los saltos discretos en la resolución puede hacerse muy pequeño, como para que parezcan continuos, pero solamente en alguna medida. Figura No. 2 Representación de localizaciones intermedias en un sistema de coordenadas entero La resolución tiene consecuencias para dar la extensión máxima del área representada. Con datos de punto flotante podría representarse el circulo del ecuador en kilómetros, pero en metros esto no es posible. A escala local esos datos pueden resolver centímetros, pero solo colocando el origen cerca al área de interés. Por otra parte la resolución es desperdiciada midiendo cada coordenada relativa a un origen distante. Actualmente se ha optado por datos de doble precisión, a costa de una baja velocidad y un alto volumen de almacenamiento. Con doble precisión hay suficiente resolución para distinguir cualquier elemento del planeta. Para propósitos de cartografía esta resolución debe ser filtrada hasta un nivel razonable. Sin embargo, es curioso usar tal almacenamiento para mediciones obtenidos a partir de mapas inexactos y a partir de sistemas de digitalización que son falibles. El análisis geográfico dentro de un SIG, involucra la integración de datos de diferentes fuentes. Los datos espaciales, ya sean en formato vector o raster, pueden ser combinados únicamente si están referenciados en términos relativos (con respecto a otro objeto) o en términos absolutos (con respecto a una localización sobre la superficie de la tierra). Esto puede solucionarse utilizando un sistema coordenado común. 2.2.1 Sistemas coordenados 4 Los aspectos referentes al sistema coordenado que debe conocer cualquier usuario de SIG, son los siguientes: ü ü ü ü 4 Las diferencias entre el Geoide, Elipsoide y la esfera Autálica. El uso de las coordenadas Geográficas Los tipos de proyecciones cartográficas. Los sistemas de Coordenadas planas. Tomado de las notas de clase de la profesora Susana Barrera 10 NOTAS CLASE SIG I ü Las formas en que se georreferencia la información en un SIG ü La manera de realizar proyecciones de un sistema coordenado a otro. 2.2.1.1 La Esfera Autálica Desde Pitágoras (Siglo V a. C), se tenía la concepción de que los humanos debían vivir en una forma perfecta. Aunque en la actualidad conocemos que la tierra no es una esfera perfecta sino un elipsoide, los cartógrafos aún utilizan la esfera conocida como esfera “Autálica” como base para sus mapas, la cual tiene un radio de 6731 Km y una circunferencia de 40030,2 Km (WGS84 y Clarke). La esfera Autálica es la superficie de referencia para mapas a escala pequeña tales como países, continentes y grandes áreas. Esto se debe a que la diferencia entre la esfera y el elipsoide es mínima al considerar grandes áreas. Para mapas a grandes escalas tales como mapas topográficos o cartas náuticas es necesario considerar el elipsoide pues debe tenerse en cuenta el achatamiento de la tierra. 2.2.1.2 El elipsoide Hasta el año 1600 la tierra se consideró una esfera perfecta, pero desde el año 1670, con la teoría de la gravitación Universal de Newton, se concluyó que debía haber un achatamiento en los polos, debido a la fuerza de gravedad generada por la rotación de la tierra. Newton, predijo que este achatamiento debía ser del orden de 1/300. Desde 1735 y hasta 1743, se hicieron mediciones en el ecuador y en Finlandia, construyendo así lo que conocemos como el elipsoide. El grado de achatamiento del elipsoide se mide como: Donde a: radio ecuatorial b: radio polar El achatamiento, generalmente es expresado como 1/f. Los valores actuales se basan en medidas de satélites y son del orden de 1/298. Ver Figura No. 3 Figura No. 3 Parámetros elipsoidales Desde 1800 hasta nuestros días, por lo menos 20 determinaciones de elipsoides se han hecho, tomadas desde varios sitios. Los cambios en los valores se deben a la precisión de los métodos utilizados y a pequeñas variaciones en la curvatura de continente y continente debido a 11 NOTAS CLASE SIG I irregularidades en el campo gravitatorio. La Tabla No. 4 muestra los valores de los elipsoides mas utilizados. Los elipsoides WGS (World Geodetic System) 72 y 84, fueron determinados por satélites y son considerados los mas precisos, aunque no necesariamente serán la mejor opción para cualquier lugar de la tierra. El elipsoide se utiliza como referencia para la elaboración de mapas a escalas grandes. Las posiciones horizontales se ajustan al elipsoide. Tabla No. 4 Elipsoides más usados Nombre WGS84 WGS72 Krasovsky Internacional Clarke Clarke Bessel Everest 2.2.1.3 Fecha 1984 1972 1940 1924 1880 1886 1841 1830 Ecuatorial 6378,137 6378,135 6378,245 6378,388 6378,249 6378,206 6377,397 6377,276 Polar 6356,752 6356,750 6356,863 6356,911 6356,514 6356,583 6356,079 6356,075 Achatamiento 1/298,257 1/298,26 1/298,3 1/297 1/293,46 1/294,98 1/299,15 1/300,8 El Geoide (Geo, tierra; como) Consiste en una forma tridimensional que resulta de la proyección aproximada del nivel medio del mar y su continuación hipotética sobre los continentes. Puede definirse como una superficie equipotencial del nivel del mar, es decir, la superficie en la cual la gravedad es igual a la del nivel del mar. Si la tierra no presentara montañas, ni depresiones y estuviera compuesta del mismo material geológico, el elipsoide y el geoide serían iguales. Sin embargo, debido principalmente a las variaciones en la densidad de las rocas y al relieve, las superficies del geoide y el elipsoide se desvían hasta en 100 m en algunos lugares. Las montañas y valles del geoide no corresponden con los continentes y montañas. De hecho, el punto mas alto del geoide se encuentra 75m sobre el elipsoide en Nueva Guinea y el mas bajo de 104m, está hacia el sur de la India. El geoide es la superficie de referencia utilizada para inspeccionar las posiciones verticales y horizontales. 2.2.2 El uso de las coordenadas Geográf icas El conjunto de latitudes y longitudes a lo largo del planeta, forma un sistema coordenado conocido como sistema de coordenadas geográficas. Ver Figura No. 4 12 NOTAS CLASE SIG I Figura No. 4 Sistema de coordenadas geográficas 2.2.2.1 Latitud. Es el ángulo medido en el centro de la tierra, desde el ecuador hasta cualquier punto ubicado hacia el norte o hacia el sur del mismo. Varía de 0 a 90°. El grupo de puntos con igual latitud forma las líneas llamadas paralelos. Ver Figura No. 5 Figura No. 5 Medición de latitud 2.2.2.2 Longitud. Es el ángulo medido en el centro de la tierra desde el meridiano de Greengwish hasta cualquier punto localizado hacia el oriente o hacia el occidente del mismo. Las líneas que conforman los puntos de igual longitud se denominan meridianos. La longitud se mide de 0 a 180° . El meridiano de Greengwishg fue reconocido como origen en la conferencia internacional de meridianos en 1884. Ver Figura No. 6. 13 NOTAS CLASE SIG I Figura No. 6 Medición de longitud 2.2.3 Los tipos de proyecciones cartográf icas. La correspondencia entre los puntos en la superficie de la tierra y un plano se hace por medio de proyecciones, las cuales son una transformación matemática utilizada para “proyectar” la forma esférica de la tierra a un plano o forma bidimensional (Figura No. 7). Figura No. 7 Proyección cartográfica a un plano Se han descrito mas de 400 tipos de proyecciones. Para el caso de Colombia, se utilizan la proyección Conforme de Gauss en la cartografía del IGAC, y la proyección Universal transversa de Mercator para el caso de la cartografía del DMA. La red imaginaria de paralelos y meridianos hace una cuadrícula, la cual tiene ciertas características que los cartógrafos tratan de preservar: Distancia, Dirección y área. 2.2.3.1 Distancia 14 NOTAS CLASE SIG I La distancia mas corta entre dos puntos en la esfera es un arco. El círculo establecido por la intersección de un plano que pasa por el centro de la tierra se denomina círculo máximo. El ecuador es el único círculo máximo; los demás paralelos se denominan círculos pequeños. Es posible realizar proyecciones de tal manera que los meridianos tengan el mismo tamaño y sean la mitad de la distancia del ecuador. 2.2.3.2 Dirección La dirección en una superficie esférica es arbitraria, pues no hay límites. Por convención N-S se toma a lo largo de los meridianos, y W-E a lo largo de los paralelos. En la cuadrícula estas líneas son perpendiculares, a excepción de los polos. Las direcciones dadas por la orientación de la cuadrícula pueden ser geográficas o magnéticas. El polo magnético se encuentra a 1300 Km al sur del Norte verdadero. La dirección va cambiando a medida que nos trasladamos por un círculo máximo del globo. únicamente a lo largo de un meridiano, o del ecuador, las direcciones permanecerán constantes. Como la distancia mas cercana entre dos puntos es el círculo máximo, los cartógrafos hacen mapas que mantienen las direcciones. Estas líneas se conocen como líneas de rumbo o loxodrómicas. 2.2.3.3 Area El área de cada cuadrícula (1 meridiano, 1 paralelo), variará. Unicamente aquellos que se encuentran entre los mismos paralelos y meridianos serán iguales. ej. 30°40’N y 30°40’S. 2.2.3.4 Factor de escala Al reducir un globo a un globo mas pequeño, decimos que el factor de escala de la reducción es igual a 1, puesto que las distancias se mantuvieron constantes: únicamente se redujeron de manera proporcional. Sin embargo, cuando queremos pasar de una superficie curva a una superficie plana, este factor de escala no será mantenido, debido a que siempre tendremos que sacrificar alguna de las tres características anteriormente descritas: distancia, dirección o área. Al utilizar una proyección. siempre se tendrá algún tipo de deformación. Las proyecciones cartográficas pueden ser clasificadas según sus propiedades, aspecto y forma. 2.2.3.5 Clasificación de las proyecciones según sus propiedades Las proyecciones se clasifican, según sus propiedades en: conformes, equivalentes y equidistantes. ü ü ü 2.2.3.6 Las conformes son aquellas que mantienen los ángulos pero no las áreas. Las equivalentes son aquellas que mantienen las áreas pero no los ángulos. Las equidistantes son aquellas que mantienen las distancias únicamente en una dirección y no deforman los ángulos. Clasificación de proyecciones según su forma 15 NOTAS CLASE SIG I Según su forma se dividen en cilíndricas, cónicas y azimutales. A su vez pueden ser tangentes o secantes. Al ser tangentes, tendrán únicamente una línea en donde las distancias tendrán un factor de escala = 1. Al ser secantes tendrán dos. A medida que se aleja de esta distancia, el factor de escala va siendo mayor, lo cual indica que habrá mayor distorsión. 2.2.3.7 Clasificación según su aspecto Según su aspecto pueden ser normales, transversas y oblicuas. 2.2.3.8 Proyección Conforme de Gauss Kruger. La proyección conforme de Gauss, tiene como origen la proyección transversa de Mercator y tiene las siguientes características: ü ü ü ü ü ü ü ü Unidades de medida: metros. Aspecto: Transversa Forma cilíndrica. Divide a Colombia en 5 orígenes. Cada origen cubre 3 grados Las coordenadas planas de cada origen son 1000000m, 1000000m. Utiliza como elipsoide: Hayford o Internacional Las coordenadas geográficas de cada origen se muestran a continuación. En la Tabla No. 5 se presentan los orígenes de coordenadas en Colombia, según la proyección conforme de Gauss. En la Figura No. 8 se presentan los cinco orígenes (en azul) empleados para Colombia, en donde puede observarse que el cilindro es tangente a la esfera a lo largo de cinco diferentes meridianos cada vez. Para el área de cubrimiento (en rojo) de cada origen, se ha determinado tres grados, debido a que allí la deformación es mínima. Más allá del área de cubrimiento, las deformaciones empiezan a ser inaceptables. Tabla No. 5 Coordenadas de los orígenes de la proyección Conforme de Gauss en Colombia ORIGEN Bogotá Este Este-Este Oeste San Andrés COORDENADAS GEOGRÁFICAS LATITUD LONGITUD 74°04’51’’30 W 71°04’51’’30 W 4°35’56’’.57N 68°04’51’’30 W 77°04’51’’30 W 80°04’51’’30 W COORDENADAS GAUSS X Y 1’000.000 m 1’000.000 m 16 NOTAS CLASE SIG I Figura No. 8 Orígenes (en azul) de la proyección Conforme de Gauss para Colombia Para cada uno de estos orígenes, tanto en sentido longitudinal (Y), como en sentido latitudinal (X), se adoptaron los valores 1’000.000m, 1’000.000m, con el objeto de evitar valores negativos en la localización de puntos. A partir de estos orígenes, las coordenadas planas aumentan de valor hacia el este (300.000 en 300.000m ) y disminuyen hacia el Oeste para los Y. De la misma manera para las X, aumentan hacia el norte y disminuyen hacia el sur (IGAC, 1979). 2.2.3.9 ü ü ü ü ü ü ü ü ü Proyección Universal Transversa de Mercator. Unidades de medida: metros. Aspecto: Transversa Forma cilíndrica. Abarca desde 84°N, hasta 80° S. Divide al mundo, en dirección E-W en 60 zonas de 6°, empezando en el meridiano 180E. Numera estas zonas empezando por el número 1 y terminado en el 60. Divide al mundo, en dirección N-S en 20 zonas de 8°, a excepción de la última norte que tiene cubre 10°. Cada zona tiene una letra, omitiendo las letras i y o y empezando en el paralelo 180S con la letra A. Ver Figura No. 9. Cada origen tiene una coordenada de 500.000m, hacia el este y hacia el oeste. En dirección N-S , el origen se encuentra en el ecuador y tiene un valor de 0 Utiliza como elipsoide el WGS84. Algunas veces el de Clarke. 17 NOTAS CLASE SIG I Figura No. 9 Sistema de coordenadas Universal Transversa Mercator 3 MODELOS DE REPRESENTACIÓN Y ESTRUCTURA DE DATOS La representación de la información geográfica se realiza estructurando los datos. Esta estructura de los datos es la que a menudo provee las diferencias técnicas claves entre los programas SIG que compiten en el mercado. Estas estructuras se basan en modelos de datos genéricos de entidades y sus relaciones e implementan estos modelos de datos. Mucha de la substancia de un modelo de datos proviene de un marco de medición, como se mencionó en el capítulo anterior. 3.1 Formas básicas de modelamiento de datos En un SIG pueden modelarse los datos en tres formas básicas: como una colección de rasgos discretos en formato vector, como un conjunto de celdas con datos de atributos para cada una de ellas o como un conjunto de puntos triangulados que modelan una superficie. Ver Figura No. 10 3.1.1 Modelo vector Los datos vector representan los rasgos como puntos, líneas y polígonos y se aplica mejor a objetos con bordes y formas definidas. Los rasgos tienen una posición y forma precisa, unos atributos y metadatos. 18 NOTAS CLASE SIG I Figura No. 10 Formas básicas de representación en SIG: Representación vector, representación TIN con perspectiva y representación raster Los marcos de medición basados en el control de los atributos son implementados más directamente usando el modelo vector. Con base en la geometría analítica, un modelo vector construye una representación compleja a partir de los elementos primitivos: puntos, líneas y áreas. Esos elementos primitivos tienen una dependencia entre sí: las áreas son descritas por líneas de límites y la localización de una línea puede ser aproximada por una cadena de segmentos de líneas que conectan una serie de puntos. En la base, los puntos son representados por coordenadas. Ver Figura No. 11. Figura No. 11 Estructura topológica 3.1.1.1 Representación de objetos aislados El marco de medición de objeto espacial visto en la unidad anterior, se traslada a una simple representación vector con cada línea y polígono definidos por una cadena de coordenadas. Cualquier cadena puede representar una línea, pero un polígono debe estar cerrado. Aquí cada objeto contiene su propia lista de puntos (coordenadas), pero no hay relaciones almacenadas. Para representar un anillo interno dentro de un polígono (polígono isla), la estructura de datos aislada a menudo emplea una línea que se repite y la cual conecta el polígono más externo con el interno. Esto adiciona una gran carga a la verificación de duplicados, la cual disminuye las ventajas de la estructura de aislamiento simple. El marco de las isolíneas, ya que usa líneas de contorno, también se traslada directamente a esta representación vector simple. Cualquier estructura en anillos para relacionar cada curva cerrada al siguiente contorno, hacia arriba ó hacia abajo, crea relaciones que disminuyen el aislamiento. Hay un potencial considerable de inconsistencias si una representación de objeto aislado es aplicada a una red conectada de polígonos. Ya que cada objeto es independiente, entonces cada borde sería representado dos veces. Un hueco o traslapo podría fácilmente ocurrir, sin que haya un método fácil de detectarlo. Esto da origen a lo que se denomina polígonos " Sliver" (Figura No. 12) 19 NOTAS CLASE SIG I Figura No. 12 Polígonos adyacentes representados por líneas de límites aislados 3.1.1.2 Representación de objetos topológicos El modelo de datos topológico es más comúnmente usado en programas que implementan un rango completo de operaciones sobre las representaciones vector. El modelo topológico incorpora las relaciones de red, junto con la medición de las coordenadas; así puede manejar los requerimientos de los marcos de coberturas conectadas. Este modelo se centra en los límites o fronteras y provee conexiones explícitas a los nodos en cada extremo, así como a los polígonos en la izquierda y la derecha. Estas relaciones pueden ser implementadas en estructuras de datos diferentes, particularmente relacionando los polígonos a sus límites y los polígonos internos a los externos. Una estructura de datos común crea una lista de longitud variable de las cadenas que encierran cada polígono, con notación para la dirección (signo positivo ó negativo). En la Figura No. 13 puede observarse las relaciones entre los componentes de una red conectada. El polígono Botswana tiene tres países, vecinos; cada vecino requiere un límite para separar los dos países; cada límite comienza y termina en un nodo. El diagrama muestra un polígono con una lista de arcos que conforman su borde externo, el signo se usa para las direcciones en reversa (to-node hacia from-node). De cualquier forma como esté implementada, cualquier estructura de datos provee acceso a las mismas relaciones mencionadas. La característica importante de todas las representaciones vector es que ellas permiten la colocación libre de los puntos y de las líneas de límite para representar categorías. Así, el modelo vector implementa directamente la intención de los marcos de medición donde los atributos sirven de control. El modelo vector puede ser aplicado a otros marcos de medición, como al TIN. Las estructuras de datos vector son el método de elección para el mapa coroplético de atributos continuos. 20 NOTAS CLASE SIG I Figura No. 13 Estructura topológica de datos 3.1.2 Modelo raster Los datos raster representan datos continuos o de imágenes. Cada celda (pixel) en un raster es una cantidad medida. La fuente más común para un conjunto de datos raster es una imagen de satélite o fotografía aérea. Un conjunto de datos raster también puede ser una fotografía de un rasgo, así como construcciones. Los conjuntos de datos raster sobresalen por almacenar y trabajar con datos continuos, como elevación, tabla de agua, concentración de polución y nivel de ruido ambiental. Mientras que el modelo vector es construido a partir de primitivas geométricas como una estructura lógica, el modelo raster tiene vínculos cercanos a la disposición física del hardware de gráficos de computador. Raster se deriva de una palabra usada en ingeniería mecánica para una herramienta que avanza en un barrido hacia delante y hacia atrás. El modelo raster divide la región en bloques rectangulares (celdas de grilla o pixels) que son completados con el valor del atributo medido. La aproximación raster está directamente relacionada a los marcos que controlan el espacio para poder medir los atributos. Las celdas raster pueden ser colocadas dentro de un sistema de referencia espacial, pero ellas deliberadamente limitan la resolución para que actúe como control. Un aspecto a considerar aquí es el tamaño de las celdas. Las celdas más pequeñas permiten al raster aproximarse a la flexibilidad del sistema vector tan cerca como sea requerido, pero surge a un alto costo por el espacio de almacenamiento. 21 NOTAS CLASE SIG I A los finales de los 70 surgió un debate acerca de las ventajas y desventajas del modelo raster vs. vector de representación. En esa época el debate giró alrededor de la eficiencia en la implementación de las estructuras de datos, más que en los modelos fundamentales. Las preferencias hechas, fueron conducidas más por la tecnología, que por la aplicación. Cada vez el debate ha hecho exclusiva alguna de las opciones, lo cual no es adecuado, pues cada representación sirve a un marco de medición y cada marco de medición tiene su uso apropiado. Es mucho más importante entallar las representaciones a los axiomas de las mediciones y ultimadamente al propósito de la organización o institución que permitir a la tecnología conducir las decisiones. En la medida en que los computadores han caído en precio, el software ha podido desarrollar una más cercana aproximación de los modelos conceptuales. 3.1.3 Modelamiento con datos triangulados Un TIN es una forma eficiente y útil de capturar la superficie de una parte del terreno. Los TIN soportan también vistas en perspectiva. Un TIN puede cubrirse con una imagen o fotografía para un despliegue foto realista del terreno. Los TIN son útiles para el modelamiento de cuencas, visibilidad, línea de visión, pendiente, aspecto, crestas y ríos, entre otros. Un TIN puede modelar puntos, líneas y polígonos. Una triangulación está hecha de muchos puntos masivos ("mass points") cada uno de los cuales tiene su x,y, y z. Las líneas de quiebre ("breaklines") representan corrientes, crestas y otras discontinuidades lineales del terreno. Las áreas de exclusión ("exclusión areas") representan polígonos con la misma elevación como lagos o bordes de proyectos. Ver Figura No. 14 Figura No. 14 Elementos de un TIN De un TIN pueden ser generados mapas de contornos, usando interpolación lineal o un algoritmo de suavización. 3.2 Implementación de modelos de representación Una base de datos implementa una representación vector de los datos, con un conjunto de datos de rasgos y con clases de rasgos, la representación raster con conjuntos de datos raster y la representación de datos triangulados con redes irregulares trianguladas (TINs). 3.2.1 Modelamiento de superficies Un SIG puede modelar una superficie de tres maneras generales: como una superficie raster, como líneas de contorno o como una red irregular triangulada. 22 NOTAS CLASE SIG I 3.2.1.1 Superficie raster Algunos datos del terreno vienen en forma de un grid uniforme con valores de elevación. Un ejemplo es el modelo digital de elevación (DEM), el cual representa unos puntos de elevación espaciados a intervalos regulares. Cada celda para un DEM tiene un valor de elevación asociado. De un conjunto de datos raster con elevaciones, la elevación de cualquier punto sobre una superficie puede ser estimada y un conjunto de contornos ser derivados (Figura No. 15). Figura No. 15 Contornos derivados de una superficie raster Las características de los conjuntos de datos raster son: • • • • • • El modelo conceptual es simple y el almacenamiento de datos es muy compacto El modelo raster tiene algoritmos muy sólidamente establecidos para procesar datos a través de funciones de análisis Los datos de elevación en formato raster son relativamente abundantes y su obtención se hace más barata. La estructura grid es rígida y no está conforme con las variaciones del terreno. Los datos originales no se mantienen cuando se interpolan a un grid. Los rasgos lineales no pueden ser bien representados para algunas aplicaciones. 3.2.1.2 Líneas de contorno Pueden ser usadas para representar superficies. Esta es una línea que une valores iguales de elevación. Los contornos son las fuentes más accesibles de información del terreno para la mayoría de usuarios de mapas. Los contornos poco espaciados son una señal clara de que el terreno en ese sitio es escarpado. Un ángulo agudo en un contorno es una señal de una línea de corriente o cresta. Uno puede tener una idea de la disposición del terreno leyendo los contornos sobre un mapa. Sin embargo, los contornos son pobres para los modelos de superficie en el computador. La colección de todos los puntos sobre los contornos no crean una buena base de datos de las superficies, pues siempre queda incierto el cambio de la superficie entre uno y otro contorno. Por otro lado, es difícil remover los artificios de los datos que introduce la conversión de los contornos a raster o a TIN, lo cual se hace necesario para crear superficies como el DEM. Esta conversión de los contornos es usualmente el último recurso que debería usarse para construir un modelo de la superficie. 23 NOTAS CLASE SIG I 3.2.1.3 Redes irregulares trianguladas (TIN) Este es un modelo eficiente y exacto para representar superficies continuas. Un conjunto de datos TIN es construido así: 1. Se colectan una serie de puntos con coordenadas X, Y y Z a través de instrumentos fotogramétricos, GPS u otros medios; se colectan las líneas de quiebre donde la forma de la superficie cambia fuertemente y las áreas de exclusión como lagos. 2. A partir de los datos de punto el software SIG crea una red opcional de triángulos llamados Triangulación Delaunay. En TIN cada triángulo es creado para ser lo más cercano posible a un equilátero. Ver Figura No. 16 3. Cada triángulo forma una cara con un gradiente (inclinación) de pendiente Figura No. 16 Face triangulada de un TIN en un espacio tri-dimensional A partir de un TIN, una elevación puede ser calculada para cualquier punto con valores X y Y, primero localizando el triángulo y después interpolando la altura dentro de él. Un TIN es eficiente porque la densidad de puntos sobre cualquier parte de la superficie puede ser proporcional a la variación en el terreno. Una superficie plana tiene con una densidad baja de puntos y un terreno montañoso requiere una densidad alta de puntos, especialmente donde la superficie cambia abruptamente. Además permite integrar las líneas de quiebre del terreno y los sitios de igual altura ó áreas de exclusión. Despliegue de superficies con un TIN: Hay diversas formas de visualizar la superficie representada por un TIN. El TIN puede ser dibujado sobre un mapa planimétrico (bi-dimensional) con colores representando elevación, pendiente y aspecto. Con despliegue tri-dimensional se pueden desplegar vistas con perspectiva de una superficie cubierta por imágenes, curvas de contornos, líneas de grid u otros rasgos. 3.2.2 Modelamiento de imágenes o datos de muestras Los datos de imágenes son coleccionados por sistemas de satélite o fotografías aéreas. Como esta es una manera costosa de coleccionar grandes cantidades de datos geográficos, las imágenes son componentes muy importantes de muchos SIG. 24 NOTAS CLASE SIG I 3.2.2.1 Conjuntos de datos raster Los datos raster pueden ser usados como fondo para el despliegue de mapas, como una fuente para extracción de rasgos para modelos de superficie en grid o para el modelamiento de funciones geográficas de proximidad como dispersión. Un software SIG puede superponer rápidamente conjuntos de datos raster. Un conjunto de datos raster almacena una matriz bi-dimensional con valores de muestras para cada celda. Cada celda tiene el mismo ancho y altura. Ver Figura No. 17 Figura No. 17 Conjunto de datos raster La coordenada geográfica de la esquina superior izquierda del grid, junto con el tamaño de la celda y el número de filas y columnas definen la extensión espacial del conjunto de datos raster. Los valores de celdas para el conjunto de datos raster pueden ser enteros o puntos flotantes y representar varias características. En fotografías, pueden representar la reflectancia de la luz; en una imagen de satélite la intensidad de la luz en una determinada parte del espectro electromagnético; puede ser un atributo derivado de una medición como tipo de uso del suelo o un tipo de rasgo como una construcción o una calle; puede corresponder también a un valor Z como una elevación o concentración. Una tabla de atributo de valores puede ser asociada, opcionalmente, con un conjunto de datos raster y en algunos software, no en todos (Figura No. 17). Un conjunto de datos raster puede tener una o varias bandas. Cada banda tiene una disposición grid idéntica, pero representa un atributo diferente. Ver Figura No. 18 Figura No. 18 Bandas en un conjunto de datos raster 25 NOTAS CLASE SIG I Conjunto de datos raster como atributos de rasgos: No todos los conjuntos de datos raster tienen una referencia geográfica, también es posible utilizar una imagen como un atributo de un rasgo geográfico. Si se está construyendo un SIG para vender casas, por ejemplo, podría esperarse que cuando un probable comprador ve un mapa con las ubicaciones de las casas, sea posible acceder a una imagen de la casa elegida al hacer click sobre su ubicación. Otros ejemplos de imágenes como atributos de características son: • • Documentos escaneados Planos o diagramas esquemáticos. Representación de puntos, líneas y polígonos: Un punto puede ser representado en un conjunto de datos raster a través de una celda o un grupo de celdas contiguas. Las líneas pueden ser representadas por series de celdas que tengan un ancho de 1 o 2 celdas. Los polígonos pueden ser representados por un rango de celdas. Ver Figura No. 19. Aunque es posible identificar visualmente puntos, líneas y polígonos en un conjunto de datos raster, lo mejor es realizar una conversión raster-vector, si se quieren manejar este tipo de geometrías. Es por ello que los software SIG traen incorporadas funciones de conversión de datos raster a vector. Figura No. 19 Representación de geometrías de punto, línea y áreas en raster Conversión de conjuntos de datos raster: Los conjuntos de datos raster pueden ser generados con facilidad, pero a veces es más conveniente tener los rasgos en otro tipo de representación. Un ejemplo es convertir una fotografía aérea de unos edificios, en un conjunto de datos vector que contenga los edificios representados como polígonos (Figura No. 20). La resolución del conjunto de datos raster influye en gran medida en la precisión del conjunto de datos vector resultante. Figura No. 20 Conversión de datos raster de una fotografía aérea en datos vector (edificios) 26 NOTAS CLASE SIG I 3.2.3 Modelado de rasgos discretos Los rasgos geográficos están localizados en la superficie de la tierra o cerca de ella. Pueden ser naturales (ríos, vegetación), artificiales (vías, tuberías, edificios), y pueden ser subdivisiones de tierra (provincias, lotes, divisiones políticas). Los conjuntos de datos vector modelan el mundo con puntos, líneas y polígonos. 3.2.3.1 Conjuntos de datos de rasgos En los conjuntos de datos vector, cada ubicación es registrada como una coordenada X,Y. Como se había mencionado, los puntos se almacenan como un único par de coordenadas. Las líneas, como una serie ordenada de pares de coordenadas y los polígonos como series de pares X,Y, que definen los segmentos que encierran un área. Rasgos punto: Los puntos representan rasgos geográficos sin área ni longitud, o rasgos que son demasiado pequeños para una escala de mapa determinada. Ver Figura No. 21 Figura No. 21 Rasgos de puntos Rasgos Línea: Representan objetos que tienen longitud pero no área, o rasgos cuya forma es demasiado angosta para una escala determinada. Ver Figura No. 22 Figura No. 22 Rasgos de líneas Rasgos polígono: Se usan para representar áreas como estados, territorios de ventas, unidades geológicas, lotes, países, etc. Los polígonos encierran áreas que cumplen con un conjunto común de características definidas por el usuario para el fenómeno que está siendo representado. Ver Figura No. 23 27 NOTAS CLASE SIG I Figura No. 23 Rasgos de polígonos Cómo los mapas presentan información descriptiva?: Los mapas muestran información descriptiva de los rasgos geográficos que representan usando símbolos y etiquetas. • • ü ü ü Las carreteras se dibujan con varios anchos de línea, patrones y colores pare representar diferentes tipos de vías u otros atributos. Las corrientes y cuerpos de agua son típicamente dibujados en azul Los símbolos especiales denotan rasgos específicos como ferrocarriles y aeropuertos. Las calles de las ciudades se etiquetan con nombres y a veces con rangos de direcciones. Los edificios especiales se etiquetan con sus nombres o funciones. 3.2.3.2 Asociaciones Rasgos, redes y topología Los rasgos pueden tener tres roles básicos ó asociaciones con respecto al otro: simple, de red y topológico. Rasgos simples: Los rasgos pueden ser simples, sin conexiones explícitas o asociaciones topológicas con otros rasgos. Estos corresponden a los marcos de mediciones de objetos espaciales. Ver Figura No. 24 Figura No. 24 Asociaciones simples de rasgos Rasgos de red: Los rasgos pueden conectarse en una red. Esta asociación corresponde a los marcos de medición de objetos conectados. Una red está compuesta de arcos (edges) con nodos en sus puntos finales. Un nodo puede conectarse a uno o más arcos. Este ensamblaje de arcos y nodos es llamado una “red geométrica”. Ver Figura No. 25 28 NOTAS CLASE SIG I Figura No. 25 Asociación de red geométrica Arcos compartidos en una topología: Este tipo de asociación corresponde a los marcos de mediciones de objetos conectados (categorías conectadas). Los elementos topológicos de los rasgos pueden ser derivados y editados. En un editor es posible especificar un conjunto de rasgos y crear una topología plana, la cual es un conjunto de primitivas topológicas: nodos, arcos y ‘caras’ (faces). Ver Figura No. 26 Figura No. 26 Asociación topológica Cuando se edita un nodo, los arcos a los que él está conectado, se estiran para ajustarse a la nueva posición del nodo. Cuando se edita un arco, también se modifica la forma de dos caras a la vez (las que están a la izquierda y derecha del arco). 3.2.3.3 Rasgos y Cartografía Los rasgos son objetos geográficos en el contexto de un mapa. Un mapa tiene una escala, la cual determina la dimensión de los rasgos: punto, línea o polígono. ü Los edificios pueden ser dibujados como polígonos si la escala es grande y como puntos a escalas pequeñas (Figura No. 27) . Figura No. 27 Dimensión de edificios a diferente escala 29 NOTAS CLASE SIG I ü Un área de bosque puede ser dibujada como árboles individuales a una escala grande y como un polígono de bosque a una escala pequeña. Ver Figura No. 28 Figura No. 28 Discriminación bosque y árboles individuales a diversas escalas ü Un río en una escala muy grande tendrá muchos puntos de forma y pequeñas ramificaciones. A pequeña escala, el detalle de las líneas es menor y las corrientes más pequeñas son removidas. Figura No. 29 Detalle de una red de drenaje a escala grande y pequeña ü Si se requiere cambiar la dimensión de los rasgos a diferentes escalas de visualización, es posible configurar una relación con otra clase de rasgos en la base de datos. En la Figura No. 30 puede apreciarse los árboles asociados con diversos tipos de bosques. Al dibujar el mapa, la escala determina qué conjunto de rasgos es dibujado. Figura No. 30 Cambio en la dimensión de los rasgos a distintas escalas de visualización SELECCIÓN DE REPRESENTACIONES En una base de datos las tres representaciones vector, raster y TIN pueden usarse. La selección de la representación a menudo es definida por los datos disponibles y las tareas de análisis. Otras veces no es tan obvio cuál es mejor. Los aspectos relevantes en la selección de una representación, se organizan en grupos, teniendo en cuenta las siguientes consideraciones: 30 NOTAS CLASE SIG I VECTOR RASTER TIN Se usa vector si se Se usa raster si se Se usa TIN si se 1. El enfoque es hacia los rasgos quiere representar trata de un área con tienen puntos y ó hacia su localización? objetos distintos con muestras uniformes valores muestreados atributos y un de atributos en un para una densidad comportamiento GRID. específico 2. Qué datos hay Se realiza un juicio sobre si los datos existentes son suficientes ó no, disponibles? para tomar decisiones como: Digitalizar, usar fotografías aéreas, GPS, convertir datos de vector a raster, de raster a vector ó de vector a TIN ó a GRID, contorno vector a puntos, etc. 3. Cuál es la exactitud Se usa vector si la La localización de Solamente la requerida para localizar exactitud requerida es rasgos aquí tiene localización de los rasgos? alta. Aquí la restricciones en puntos y las líneas identificación y dependencia del de quiebre son selección de rasgos es tamaño de la celda. exactos. más fácil. Los valores precisos de coordenadas son almacenados. 4. Qué tipos de rasgos es Para representar Si se modelan rasgos Si se modelan requerido representar? algunos rasgos grandes, con valores rasgos que naturales como que varían, cambian caracterizan la sistema de drenaje o con el tiempo o tienen forma de la construcciones hechas límites indistintos. superficie de la por el hombre tierra, como (infraestructura vial, montañas, picos, oleoductos, u otras parte aguas, con arcos circulares) drenajes. 5. Qué tipo de asociación Algunos objetos son aislados, entonces no requieren relaciones con topológica? otros. Otros se almacenan para servir de fondo, entonces no requieren topología. En otros casos es necesario manejar redes conectadas, bien sea de rasgos lineales como drenaje (arcos y nodos permiten la conexión) ó bien sea de categorías conectadas (cada punto está cubierto por un polígono) 6. Qué tipo de análisis es Para la localización Dispersión de un Funciones para requerido? óptima de elementos rasgo indeterminado generar pendientes, (por ejemplo en el tiempo (pluma aspectos, negocios), servicios, de contaminación), construcción de flujos a través de análisis de perfiles, cálculo de conexiones (redes) proximidad, de volúmenes distancias con costo y coincidencia espacial de varias características. 7. Qué tipo de mapas Rasgos más finos, Rasgos que ocupan Superficie s y sus tienen que ser producidos? más pulidos gran espacio, con cambios, con variación continua. perspectivas 3D. CONSIDERACIONES 31 NOTAS CLASE SIG I 4 CONVERSION DE DOCUMENTOS EXISTENTES (DIGITALIZACION) El proceso de representación va más allá de las formalidades de diseñar un modelo de datos en computador. Cada fuente de datos envuelve muchas decisiones prácticas para convertir estas fuentes a estructuras apropiadas para el procesamiento posterior. Como un ejemplo de todas las posibilidades está la digitalización usando el método manual o la tecnología de escaneo. En los períodos tempranos del SIG, no había recursos de datos digitales existentes. Cualquier proyecto tuvo que empezar con el proceso de construir una base de datos desde el principio. En algunos casos una fuente digital como los sistemas de sensores remotos, pudieron proveer las fuentes de datos, pero por otra parte, el único recurso fue la conversión de la información existente, típicamente en forma de mapas en papel. Este proceso es llamado conversión, por que él convierte las representaciones físicas dentro de datos digitales. Incluso ahora, el proceso de construcción de bases de datos puede ser muy prolongado. La industria de conversión actualmente consume una gran cantidad del presupuesto anual, para generar información geográfica en todo el mundo. Cuando los materiales son ya digitalizados, esta cantidad del presupuesto declina. Aún así, el proceso de digitalización provee una herramienta organizacional excelente para confrontar los tópicos de representación. Un SIG siempre está “hambriento” de datos. Las fuentes de información existente, la mayoría en forma de mapas y tablas de atributos, son a menudo tomadas como servicios, sin reflexionar mucho acerca de su contenido. La tecnología de construcción de mapas, simbolización y distribución, limita la representación de fenómenos espaciales, imponiendo ciertos marcos de medición. Sin embargo, no importa que tan limitado ellos son, estos recursos de información son a menudo los más buenos que pueden encontrarse dentro de los presupuestos de tiempo y dinero. La digitalización ha consumido, usualmente, la mayor tajada de los presupuestos de los proyectos, frecuentemente más de la mitad del total de los fondos. Esos costos pueden ser controlados mejor, entendiendo la naturaleza de los materiales de entrada y las relaciones que deben ser creadas en la base de datos. La planeación general del proyecto a realizar, es fundamental para empezar con el proceso de digitalización. Esto, debido a que es necesario tener claro que se quiere del SIG, y por tanto, de qué manera se ingresarán los datos al proyecto. Una correcta planeación, evitará horas de edición. Las primeras preguntas que deben hacerse en un proyecto de digitalización son: 1. 2. 3. 4. Cuál será el propósito de los datos? Se unirán con una base de datos mayor? Con qué software de SIG, se utilizarán los datos? Qué sistema coordenado se debe utilizar? Depende del objetivo del proyecto, puesto que cada transformación de un sistema a otro, adicionará errores al mapa. 5. Cuál es la exactitud de las coberturas a ser combinadas posteriormente? (bordes comunes, generalizaciones, etc. 6. Cuál es el objetivo final del mapa? Que tipo de exactitud requiere su representación final? 7. Qué paquete trabaja la institución para la cual se está desarrollando el proyecto? Es mejor introducir datos directamente en el paquete en el cual se procesarán. Si es posible. El proceso general de entrada de datos al SIG, se observa en la Figura No. 331. 32 NOTAS CLASE SIG I DATOS DEL MUNDO REAL INFORMACION ESPACIAL INFORMACION NO ESPACIAL ENTRADA DE DATOS ENTRADA EN ARCHIVOS DE TEXTO UTILIZANDO EL TECLADO DIGITALIZADOR SCANNER VERIFICACION VISUAL LIMPIEZA DE LINEAS Y UNIONES ELIMINACION DE EXCESO DE COORDENADAS CORRECCION DE ESCALA Y DEFORMACION CONSTRUCCION DE POLIGONOS ADICION DE IDENTIFICADORES ENLACE DE INFORMACION ESPACIAL Y NO ESPACIAL CORRECCION TOPOLOGICA Y CREACION DE BASE DE DATOS Figura No. 331 El proceso de la digitalización 33 NOTAS CLASE SIG I Los datos en un SIG, pueden ser ingresados de diferentes formas: ü ü ü ü ü ü Digitalizando con la ayuda de una tabla digitalizadora (calcado vector). Escaneando mapas Digitalizando en pantalla. Por medio de colección de datos de GPS Por medio de imágenes de satélite. Por medio de archivos que ya se encuentren en formato digital (vector o raster). 4.1 Calcado Vector El método más directo para digitalizar un mapa, es medir los movimientos de desandar los puntos y las líneas. La visión temprana de la cartografía automatizada (entre 1958 y 1962) comenzó con una tabla de dibujo automatizada donde la máquina grababa el movimiento de un puntero (Coppock y Rhind, 1991). El prototipo de lo que nosotros llamamos ahora una tableta digitalizadora movía, para todos los lados, un gran imán debajo de la superficie de la tabla, direccionándolo de acuerdo con la señal emitida por el puntero. Las digitalizadoras modernas usan técnicas diferentes usualmente basadas en detectar la posición del cursor en relación con una grilla de alambres fijados dentro de la superficie de la tableta. La exactitud de la posición depende de la finura de la grilla de alambres y del hardware de detección de la señal. Las mejores tablas digitalizadoras pueden tener una precisión de 0.075 mm., aunque ellas usualmente registran en unidades enteras de 0.01 pulgadas (Jackson y WoodsFord, 1991). Las tabletas de más bajo costo pueden incluso proporcionar exactitudes de 0.25 mm. ó de 0.5 mm., para áreas más pequeñas. Estas precisiones, reflejan las capacidades de medición pura del dispositivo, no la exactitud que pueda tener un operador, al digitalizar sobre la copia dura. Los sistemas de digitalización pueden medir la localización del cursor, bien sea cuando son disparados por un botón (modo punto) o sobre una base continua (modo “stream”). El modo continuo puede registrar una localización después de un tiempo fijo o de un desplazamiento dado. Cada método tiene sus desventajas. Los operarios de digitalización deben posicionar su cursor sobre los símbolos en el mapa. La exactitud del resultado, depende de la amplitud del símbolo gráfico, el estrés impuesto sobre el operario al tener que oprimir el cursor a lo largo de una tabla grande, en ángulos difíciles y muchos otros factores. El modo punto claramente aplica a los objetos punto y aplica también a rasgos rectilíneos tales como límites de propiedades. El modo continuo (“streem”), puede proporcionar un resultado más aplicable a líneas sobre el mapa más complejas, aunque requiere de filtrado para desechar el sobre muestreo. El modo “streem” puede forzar a un operador a moverse lentamente, ya que el cursor debe permanecer en la línea en todo momento. En la digitalización manual, el operario humano interactúa con el software para codificar los rasgos de un mapa. La capacidad de reconocimiento de patrones por parte del ser humanos es particularmente importante, cuando los mapas incluyen muchos símbolos diferente, o cuando es relevante únicamente una porción de la información. La digitalización manual es menos exacta que la de los “scanner” de alta calidad y en ella son posibles más formas de error. Es muy difícil motivar a los operarios de digitalización a que funcionen bajo condiciones tan exactas. Desarrollos recientes de hardware y de software han comenzado a manejar esta dificultad con el sistema “heads up”5 de digitalización. 5 Es una estación de digitalización que proporciona una interfaz gráfica de usuario sobre la pantalla de una estación de trabajo (por eso se llama a veces digitalización sobre pantalla). El operador usa un 34 NOTAS CLASE SIG I Existen varios elementos que pueden ser digitalizados: Redes, polígonos, puntos, y curvas de nivel o isolíneas en general. Redes: es necesario empezar en uno de los puntos extremos de la red. Posteriormente, puede digitalizarse como cualquier línea. Cuando una línea, llegue a la otra, la digitalización debe detenerse. Nunca debe cruzarse una línea con otra. La intersección entre dos líneas está representada por un nodo. Polígonos / áreas: se digitalizan en modo continuo, y si es posible se utiliza la opción de “snap” para cerrar las áreas. Recuerde que sólo debe digitalizarse una vez cada borde. La topología se encargará de identificar los polígonos. Contornos: inicialmente debe conocerse el intervalo de curvas que quieren digitalizarse. Las curvas deben ser continuas y no pueden estar interrumpidas por el texto con el número de la altura. 4.2 “Scaners” raster Desde los primeros días del SIG, ha habido una búsqueda de una forma de abolir el trabajo pesado y las inexactitudes de la digitalización manual. En los años 60’s el CGIS (Sistema de Información Geográfica del Canadá) diseñó su esquema, alrededor de un escáner que consistía en una lámpara, una fotocelda, un tambor para rotar el mapa y un motor para mover el equipo que captaba los datos, el resultado fue un barredor por líneas del mapa original. Tecnologías similares han sido desarrolladas explícitamente para mapas, algunas introduciendo lasers de alta precisión sobre tambores rotantes para trabajos de diferenciación de colores, otros intentando realizar el seguimiento de líneas directamente. Sin embargo, el más grande adelanto viene del mercado de los consumidores. Las demandas de máquinas copiadoras y facsímiles han requerido escáners raster baratos y exactos – “push broom”. Una máquina de fax moderna tiene un arreglo de dispositivos de carga acoplados (CCD), de foto detectores, frecuentemente con 5000 elementos. Múltiples arreglos pueden ser dispuestos para cubrir las grandes amplitudes de mapas y otros dibujos. Cada detector reporta un valor de escala de grises (o un valor de color). Acoplados con un mecanismo para mover el papel (o los detectores), estos detectores se convierten en un “scanner”. La resolución de los detectores CCD, cada vez es más fina; una resolución de 0.025 mm (1000 puntos por pulgada) ó mejor, puede ahora ser comprada por menos de lo que hace 10 años costaba uno de 0.2 mm. La exactitud de estos “scanner” puede ser aún mayor de 0.5 mm. De acuerdo a la teoría básica de muestreo, un scanner debe muestrear a la mitad de al amplitud de una línea para asegurar su detección. Una línea de 0,1 mm (0.004 pulgadas), requeriría una resolución de barrido de 0.05 mm. Los mapas poco pulidos, pueden ser escaneados con muestreos más gruesos, tal como con scannes vendidos para labores de publicación, aunque estos scanners no tienden a ser lo suficientemente grandes para hojas de mapa completos. Un escáner captura una imagen del simbolismo gráfico. Usando operaciones de vecinos cercanos, el boceto de una línea puede ser aislada y convertida a una representación vector. Las uniones de línea, sin embargo, aún son un problema para la detección automatizada. La extracción de líneas depende de la resolución de pixeles del scanner, pero aún más, depende de la naturaleza del mapa original. Hay varias técnicas diferentes que utilizan mapas escaneados para grabar datos espaciales. Un método consiste en escanear un mapa y posteriormente utilizarlo como fondo desde el cual se pueda digitalizar puntero (por ejemplo un mouse) para navegar sobre la imagen, escaneada de la fuente original, sin tener que mirar hacia abajo como con la tableta digitalizadora. 35 NOTAS CLASE SIG I sobre pantalla. Otro método consiste en utilizar software sofisticados para la conversión de datos raster en datos útiles para el SIG. En el momento de escanear un mapa, es necesario tener en cuenta lo siguiente: ü Qué tipo de imagen se requiere según el objetivo específico (Blanco y negro o color) . ü Qué resolución medida en puntos por pulgada (dpi). ü Cual será el tamaño del archivo según la resolución seleccionada: A mayor resolución (Puntos por pulgada), mayor cantidad de bits requerida y archivo mas grande. ü La limitación de la resolución generalmente estará dada por la posible resolución del escáner. ü Algunas veces la limitación puede ser el tamaño de archivos de imágenes de los hardware. ü Si se escanea a color (verdadero, falso), se requiere un mayor número de bits y por tanto el tamaño del archivo será mayor; a mayor selección de dpi, mayor resolución espacial y mayor tamaño del archivo. La combinación de un escáner con una estación de trabajo interactiva, le permite a un operario ver el gráfico escaneado y aplicar los algoritmos de detección de líneas. Esta combinación es llamada digitalización “heads up”. Alternativamente una fotografía escaneada, puede ser usada como fondo para interpretar, replicando así el ambiente tradicional de compilación de mapas. La pantalla de la estación de trabajo se convierte en un dispositivo de despliegue flexible para el material gráfico, ofreciendo la habilidad de pan y zoom sobre una gráfica virtual grande. Un simple mouse puede seleccionar los elementos de esta imagen en forma tan exacta como sobre una tabla grande de digitalización. Estas técnicas de escaneo han hecho que las de digitalización manual se vuelvan obsoletas. 4.2.1 Consideraciones de la resolución: ü La resolución es la densidad de pixeles en una imagen raster en una distancia dada. ü Debido a que las pulgadas son una unidad común de medida en los países en donde se desarrolla software, punto por la pulgada (DPI) es la unidad utilizada frecuentemente. ü Como una fila escaneada tiene como longitud un pixel, el proceso de alimentación de un escáner es mas eficiente manejando mapas grandes. ü El usuario debe saber manejar de una forma equilibrada la resolución y el almacenamiento de la información. ü Un aumento de 2X en la resolución producirá una imagen con un tamaño de almacenamiento cuatro veces mayor. ü Use la siguiente regla como base6 : 200 dpi para poder ver textos y artes. 300 dpi para ver la mayoría de las fotografías 400 dpi para ver ortofotos de alta calidad. ü Con las consideraciones de arriba, un escáner de 600 dpi, puede responder a la mayoría de las necesidades. 4.2.2 Escala y Exactitud ü Recuerde que un mapa escanedo nunca podrá ser mas preciso que el mapa original. 6 Tomado de GIS Data Conversion 36 NOTAS CLASE SIG I ü La exactitud se refiere a que tan correctos son los datos, mientras que la precisión se refiere a la cantidad de detalle presente en los datos. Según esto, es posible tener un mapa escaneado muy preciso pero inexacto. ü Una manera para controlar la exactitud consiste en usar los mejores mapas posibles como fuente. Recuerde que el papel se estira o se encoge a medida que cambia la humedad del ambiente. Aunque se tenga un ambiente adecuadamente controlado, los puntos anteriores son mas importantes que este último. 4.2.3 Preparación del Mapa Los mapas requeridos para trabajar con SIG, deben estar geo - referenciados. Por esta razón es necesario dibujar puntos de control en el mapa, si no están disponibles en el medio impreso. Es más fácil hacer esto antes de escanear el mapa que después. Aun, si se tiene un escáner de alta resolución, algunas características pueden no ser mostradas, debido a que son símbolos complejos, sombreados, u otro tipo de patrones. Por esta razón, es necesario en algunas ocasiones, iluminar o redibujar ciertas características en donde sea difícil la diferenciación. En general, se deben utilizar las siguientes reglas (GIS data conversión): Nunca escanear un mapa sin puntos de control Nunca escanear un mapa sucio Si usted necesita pegar el mapa, utilice la mejor cinta posible. Nunca utilice marcadores permanentes con base en petróleo (Estos pueden destruir su escáner) ü Nunca dibuje con lápiz (grafito) ü Evite terminaciones poco definidas. ü ü ü ü 4.2.4 Otras consideraciones ü Es preferible escanear en la resolución (dpi) que viene por defecto, a no ser que conozca perfectamente la resolución espacial final y el tamaño deseado de la imagen. ü Es preferible escanear en formato de colores 24-bits aún si la imagen está en blanco y negro, esto le proveerá una más alta resolución espacial, si ésta se requiere. ü Es preferible escanear utilizando el formato TIFF a no ser que se conozcan otras especificaciones de software. Los archivos tipo TIFF pueden ser transformados fácilmente a varios formatos. 4.3 Colección de datos de GPS El GPS (sistema de posicionamiento global) permite calcular las coordenadas de cualquier punto, línea o área geográfica, así como la creación y utilización de un diccionario de datos que facilita el ingreso de información descriptiva sobre las características7 geográficas que se están midiendo. El GPS, además de calcular las coordenadas de un nuevo punto, con un intervalo de tiempo de hasta un segundo, permite calcular la velocidad, si el operador se encuentra en movimiento e incluso puede localizar un punto de coordenadas conocidas, introducidas previamente dentro del receptor, a partir de cualquier lugar con su opción de navegación. 7 Se habla de características “features”, cuando se trata de un objeto definido previamente con un nombre conocido en el diccionario de datos. Ejemplo casa, lago, etc. Se habla de posiciones o puntos de coordenadas (positions) cuando no se han definido objetos específicos. 37 NOTAS CLASE SIG I Una vez se hayan tomado las medidas en campo, es posible pasar los datos a un software. El software permitirá corregir diferencialmente los datos para mejorar su precisión, desplegarlos gráficamente y transferirlos a un SIG. Dentro de los factores que pueden afectar la precisión de los datos, la cual puede tener un valor entre 1 y 100 m, se encuentran el número de satélites a la vista, la posición de los satélites en relación con otros, la fuerza de la señal de los satélites y la distancia entre los GPS base y móvil. Los factores más importantes son el equipo y los métodos de procesamiento de datos. En una operación standard, el GeoExplorer II, por ejemplo, provee una precisión horizontal típica del orden de 2 a 5 m. Para obtener este grado de precisión, el GeoExplorer debe estar configurado correctamente y los datos deben ser corregidos diferencialmente. Los parámetros que deben ser configurados se explicarán a continuación, al igual que la corrección diferencial. El receptor GeoExplorer II, permite también recolectar datos con una precisión inferior a 1 metro cuando se trabaja en el modo de alta precisión (High Accuracy) y se toman datos de una sola posición por 10 minutos. Los datos obtenidos con esta opción, además, deben ser corregidos diferencialmente con los datos de la base, también en el modo de Alta posición (carrier phase data). Los datos deben además ser procesados utilizando la opción (Phase processor) del software. 4.3.1 La corrección Diferencial La corrección diferencial, es un técnica que utiliza un receptor extra y algunos cálculos para mejorar la precisión del GPS. Este proceso se basa en que los errores en la señal de un GPS serán comunes en un radio de cerca de 500 Km. El GPS diferencial, puede ofrecer precisiones entre menos de 1 m y hasta 5m (Error Circular Probable8 - ECP). La opción diferencial, requiere que un receptor conocido como estación base, esté localizado en un sitio de coordenadas conocidas. La base, recibe los datos del GPS de los satélites que tiene a la vista, mientras uno o más receptores (rover) reciben los datos de localizaciones desconocidas, utilizando el mismo grupo de satélites para tal fin. Las posiciones grabadas por la base son comparadas con las coordenadas conocidas y las diferencias son utilizadas para mejorar la precisión de las posiciones del rover. Las correcciones diferenciales pueden ser aplicadas mientras los datos son colectados en campo, utilizando radios. Este procedimiento se denomina GPS Diferencial en tiempo Real. Las correcciones diferenciales también pueden ser aplicadas en la oficina, una vez los archivos del rover y de la estación se transfieran al computador. Este procedimiento se denomina corrección diferencial postprocesada. 4.3.2 La corrección en Tiempo Real Cuando se trabaja en el modo de corrección diferencial en tiempo real, la estación base calcula las posiciones y los radios hacia los demás receptores y a partir del error de cada satélite envía un mensaje a cada rover de tal forma que el error es corregido. El resultado es que la posición desplegada en el receptor es corregida diferencialmente en tiempo real. Este método debe usarse si es necesario conocer la posición precisa mientras se está trabajando en campo. Como las posiciones son calculadas, pueden ser grabadas en un archivo o almacenadas como puntos de paso. 8 Error Circular Probable (ECP) significa 50% de los puntos colectados están dentro de un círculo de radio específico sobre un plano horizontal. 38 NOTAS CLASE SIG I 4.3.3 Corrección Diferencial Postprocesada Para la corrección postprocesada, la estación base guarda datos de tiempo para cada satélite en un archivo. El receptor rover, graba las posiciones en un archivo que posteriormente es transferido al computador. Los dos archivos son procesados con algún software y el resultado es un archivo rover corregido. Una característica de todos los GPS Pathfinder Trimbel, incluyendo el receptor GeoExplorer II, es que pueden grabar información no corregida y en tiempo real. Si la señal de los datos del GPS diferencial se pierde o se vuelve intermitente, el receptor GeoExplorer, continúa grabando posiciones no corregidas que pueden posteriormente ser corregidas en la oficina. 4.4 imágenes de satélite. Otra forma de ingresar datos al computador, la cual se está constituyendo en una de las más utilizadas, es por medio de imágenes de satélite, las cuales pueden ser procesadas y su información utilizada para ser combinada con otro tipo de temas. Las imágenes de satélite trabajan en formato raster, pero después de haber obtenido algunas categorías, producto por ejemplo de las clasificaciones de coberturas, requeridas para un estudio específico, pueden ser vectorizadas, utilizando las opciones que ofrecen los diferentes SIG. Otra forma de explotar las imágenes de satélite dentro del SIG, puede ser por medio de digitalización por pantalla tal como se indicó anteriormente. 4.5 Archivos que ya se encuentren en formato digital (vector o raster). Otra forma de ingresar datos al computador, es a partir de archivos digitales, los cuales pueden estar en diferentes formatos. Cada software de los que compite en el mercado, tiene desarrolladas una serie de rutinas que permiten exportar e importar archivos de datos para su transferencia. La ayuda en línea en cada uno de ellos, le permite al usuario enterarse acerca de todas sus posibilidades. Actualmente, transferir datos de un programa SIG a otro, ha dejado de ser una dificultad. Entre los software más comerciales como ArcView, Arc/Info, IDRISI, Geomedia, Ilwis, GENAMAP, esto ya no es un problema, pues cada uno tiene desarrolladas las rutinas para transferir de unos a otro programas. Los programas que no transfieren los datos de un software específico emplean, por lo general, archivos tipo ASCII para realizar la transferencia, entre los cuales los más comunes son los archivos de texto, como el .DXF. Los datos estructurados en forma raster también pueden transferirse de un software a otro, usando archivos de tipo ASCII y binario. 5 TRANSFORMACION DE MEDICIONES POR DIGITALIZACION A COORDENADAS Se efectúa a través de dos etapas: registro y proyección 5.1 Registro Es el proceso de conectar una representación espacial a un sistema de referencia espacial, para lo cual se usan los puntos de control (Tics para digitalización por mesa), con sus coordenadas en unidades de digitalización y sus coordenadas reales. En el proceso, el software ajusta todas las posiciones digitalizadas a sus localizaciones, dadas por un sistema de coordenadas. Esas localizaciones son definas por coordenadas X y Y, calculadas a partir 39 NOTAS CLASE SIG I de una transformación, la cual toma en cuenta suposiciones sobre el estado del mapa y la forma como la digitalización fue realizada. 5.1.1 Transformaciones entre coordenadas de los puntos de control y unidades de digitalización Cuando la digitalización se realiza, siendo este un proceso muy falible, hay posibilidad que tanto los errores humanos, como el estado en el que se encuentren los mapas fuente, haga que los puntos digitalizados sufran deformaciones las cuales son “corregidas” a través de los parámetros que contienen las ecuaciones resultantes de la transformación. Los aspectos que son “corregidos” en cada caso, definen los diversos tipos de transformaciones. 5.1.1.1 Transformación similar Cundo se considera que el mapa es rígido (el papel no sufrió deformaciones) y simplemente se rotan, se trasladan y se escalan los puntos digitalizados. Una simple ecuación muestra esta transformación: X = A+ Cx + Dy Y = B - Dx + Cy Donde: C = Factor de escala por el coseno del ángulo de rotación D = Factor de escala por el seno del ángulo de rotación A y B = Desplazamiento para el centro de rotación en las coordenadas de salida El procedimiento de transformación sigue los siguientes pasos: 1. Con base en las unidades de digitalización y las coordenadas reales de los puntos de control (Tics) y empleando para el cálculo una regresión, coeficientes indeterminados, u otros, son calculados los coeficientes A,B,C y D. 2. Para cada punto de control se resuelven las dos ecuaciones (en donde las incógnitas serían X y Y y x y y, son las unidades de digitalización), lo cual permitirá evaluar que tan bueno fue el ajuste y cual de los puntos aporta más al error medio cuadrático (RMS) total. 3. Se corrigen o suprimen aquellos puntos que están aportando más al error 4. Se transfieren todas las demás localizaciones de los puntos digitalizados a la nueva posición. 5.1.1.2 Transformación fina (“affine”) Se usa cuando la escala no es la misma en los dos ejes (el escaner se pudo mover diferente en las dos direcciones o el papel se contrajo o se expandió). La transformación “affine” provee dos escalas diferentes en cada eje X y Y: X = A + Cx + Dy Y = B – Ex + Fy C,D,E,F: Combina escalas diferenciales de X y Y y rotación A y B: Desplazamiento para el centro de rotación en las coordenadas de salida 40 NOTAS CLASE SIG I Los procedimientos son exactamente igual a los descritos arriba, con la diferencia de que el cálculo de los coeficientes considera las escalas diferenciales de cada eje. 5.1.1.3 Transformaciones más complejas Por ejemplo la transformación proyectiva de Arc/Info. Sirven para modelar distorsiones de lentes fotográficos o un orden polinomial mayor. Aquí más puntos de control son requeridos 5.1.2 Errores en las transformaciones Los errores ocurridos en las transformaciones son de dos tipos diferentes: pequeñas variaciones y errores graves. Las variaciones pequeñas son ineludibles en cualquier sistema de medición. Tomando mediciones adicionales, este tipo de error de azar puede ser controlado fácilmente. Para los errores graves (error en digitalización, cambio de valores para X y Y, etc.) se mira la diferencia entre los valores ajustados y los valores reales, se eliminan los valores grandes y se reajusta la transformación. Para nuestro caso el error usado es el medio cuadrático (ERM), el cual es la discrepancia entre el valor verdadero de la coordenada de un punto y el de la coordenada actual obtenida para ese mismo punto, usando las ecuaciones de la transformación. El error se calcula como la discrepancia de valores para cada coordenada: X y Y. 5.2 Proyecciones La práctica normal transforma las coordenadas del dispositivo de digitalización directamente a la proyección seleccionada como sistema de referencia espacial. Este procedimiento puede no ser adecuado en algunos casos, pues oscurece los pasos intermedios. Algunas fuentes (mapas, fotos) ya tienen una proyección, si no es igual a la de destino, los sistemas van a diferir. Localmente las diferencia puede consistir en una transformación similar rígida, pero a escala grande las diferencias pueden ser muy sustanciales. Si la transformación de coordenadas de digitalización a coordenadas de mapa es rígida y la transformación del mapa a la proyección es rígida, entonces una transformación directa de la digitalización a la proyección también será rígida. En este caso, no habría razones para pasar a través de pasos intermedios. Por otro lado, si se requiere alguna corrección (por ejemplo ajustar la geometría del escáner, distorsión de lentes, encogimiento diferencial o convergencia de proyección de fuentes existentes), entonces una única transformación no podrá modelar la combinación de distorsiones geométricas. Algunos países reducen la dificultad, organizando una proyección única como un sistema de referencia espacial común, pero en países más grandes una sola no cubrirá todo el territorio, sin distorsiones (el caso de Colombia). Hay un número infinito de ecuaciones de proyección y de parámetros que controlan la geometría final. La selección de proyecciones de mapas es a menudo una materia de tradición, vinculada a el desarrollo histórico de un conjunto dado de usuarios de mapas. Los mapas de navegación son casi universalmente dibujados en proyección Mercator, con el Ecuador como paralelo central y es conforme (preserva los ángulos). Para mapas topográficos, la mayor parte del mundo es cubierta a algunas escalas en Universal Transversa Mercator o en Lambert conforme Cónica. Los sistemas de referencia estándar adoptan universalmente una proyección conforme, que acepte una cierta cantidad de error de escala, para preservar los ángulos locales. Las proyecciones iguales de las áreas son más útiles para muchos tipos de análisis con SIG. 41 NOTAS CLASE SIG I Con los mapas computarizados las ecuaciones de proyección no son tan difíciles. Un mapa en una proyección puede ser convertido a latitud-longitud (a través del inverso de la función de proyección) y después proyectado a otra forma. 5.3 Referencia a servicios Geodésicos La digitalización puede conectar las coordenadas locales del equipo de digitalización a sistemas de referencia espacial permanentes. Eventualmente todas las proyecciones están relacionadas a posiciones sobre la superficie de la tierra. Por razones históricas la forma más común de referencia a las coordenadas geográficas es la latitud-longitud. Esos dos ángulos suponen un radio para una esfera o un elipsoide dado, para especificar una localización en un cuerpo tridimensional. Actualmente hay muchos elipsoides en uso , sin embargo las mediciones más precisas se realizan hacia los estándares internacionales para la forma de la tierra, que fueron presentados en la Tabla No.. Los mejores puntos para ser usados en el registro son los de referencia geodésica usados para construir los mapas originales o puntos cuyas coordenadas se conozcan de levantamientos especiales. La práctica común en digitalización da mucha fe a las esquinas de las planchas y a otros simbolismos que no están precisamente relacionados con la construcción en sí del mapa usado. En el pasado los levantamiento geodésicos fueron muy costosos y el proceso de ajuste fue muy complejo. Las observaciones formaban un red compleja de triángulos para conectar las áreas de interés y reducir los errores. Los GPS han revolucionado muchos aspectos de las mediciones espaciales. Usando este sistema de satélites de comunicación un receptor puede observar cuatro ó más satélites que transmiten, calcular la distancia a cada uno y almacenar el resultado como coordenadas proyectadas a un sistema. Con un segundo receptor ubicado en un punto conocido, un levantamiento de GPS diferencial puede proveer resultados geodésicos de calidad, sin todos los requerimientos intermedios de las tecnologías convencionales. Los sistemas de mapeo han sido estructurados alrededor de suposiciones como que el control geodésico permanecerá costoso. Sin embargo, las herramientas para integrar datos espaciales serán cada vez más importantes, si el GPS guía a las fuentes de información referenciada a que tengan coordenadas medidas en campo. Esta fuente de mediciones disminuiría la necesidad de digitalizar mapas existentes. Antes de evaluar la calidad de las coordenadas, se requiere recordar que la información geográfica es a menudo una abstracción. Es poco importante registrar la localización de un símbolo de pantano más allá de centímetros, sabiendo que él representa una región sin bordes claramente definidos. El contenido de la información de una medición no requiere una exactitud alta para todas las coordenadas. 6 CALIDAD DE LOS DATOS Una vez un conjunto de medidas ha sido organizado dentro de un sistema de representación, resulta prudente considerar que tan bien las mediciones realizan su trabajo. La primera palabra que se viene a la mente es exactitud. Los mapas como mediciones son generados para ser exactos; mientras la exactitud evoca los elementos espaciales del mapa, hay un número de tópicos relacionados, que quedan mejor organizados bajo el título de calidad de datos. Todas las medidas pueden ser verificadas de alguna manera comparándolas con el mundo ó entre ellas. Sin embargo, la mayoría de información geográfica, involucra una simplificación útil del fenómeno, para ajustarlo dentro del marco de medición; por eso, la verificación no es un proceso simple de revisar cada cosa contra un objetivo 42 NOTAS CLASE SIG I estándar. De esta forma, el proceso de medición completo, debería ser verificado para asegurar que la información se ajusta a su propósito. En la como como datos estructura conceptual que estamos manejando, los tópicos de calidad de datos no se ajustan un anillo dentro de las mediciones, representaciones y operaciones y transformaciones, sino una reflexión sobre los resultados de representar una medida dada. Los tópicos de calidad de son centrales para evaluar los resultados de digitalización y de cualquier otra representación. 6.1 Verificación y control de calidad El estado de la medición en la digitalización, está lejos de ser el fin del proceso. La verificación y control de calidad ocupan una mayor porción del esfuerzo en la construcción de un SIG. El resultado burdo de un procedimiento de digitalización ya sea manual ó automático, crea un conjunto de objetos geométricos. El término técnico para esta masa de geometría es “spaghetti cartográfico”, debido a que está, no más estructurada, que un spaghetti sobre un plato (Christman, 1974). Un archivo spaghetti puede ser usado para dibujar objetos geométricos de fondo, aunque pueda tener pequeñas fallas geométricas introducidas por el sistema de digitalización. Las fallas pueden ser removidas por inspección visual y manipulación gráfica, frecuentemente la aproximación usada con sistemas de diseño asistido por computador (CAD). 6.1.1 Edición de errores El modelo topológico fue desarrollado para reducir el esfuerzo en la verificación de los resultados de la digitalización. Introduciendo un conjunto más complejo de axiomas, las relaciones entre objetos pueden ser creadas con menos dificultad. Específicamente, el modelo topológico prohíbe el cruce de las líneas con otras. Todos los cruces deben ser declarados como nodos, convirtiendo una maraña de líneas a un grafo planar simple (ver Figura No. 26). Esta verificación puede ser hecha automáticamente por el mismo software que realiza la superposición de polígonos o en un ambiente interactivo (lo hace el usuario). Una vez un grafo ha sido construido puede ser verificado de acuerdo con requerimientos adicionales. Para coberturas categóricas como parcelas o suelos, el propósito de las líneas es separar polígonos; por lo tanto, cualquier arco que termine en un nodo final muerto, es un signo de algún tipo de error. Este error se da bien sea porque un arco esté ausente o por que sobre (“undershoot” o “overshoot”). Ver Figura No. 332. En lugar de tener que inspeccionar el mapa completo, el operario puede dirigir su atención a corregir estos errores directamente. En la figura puede observarse que el error se produce por una línea faltante que es la primera opción, por una línea que no alcanza a llegar al nodo o por una línea que sigue adelante después del nodo. La siguiente fase en cualquier digitalización involucra los atributos. Cuando se almacena información geográfica en un SIG, cada característica geográfica tendrá dos tipos de datos almacenados: ü Información acerca de su localización en forma de coordenadas geográficas explícitas. ü Información descriptiva en forma de valores de atributos estandarizados. Cada capa puede tener por ejemplo, los atributos de número de habitaciones, número de pesos, tipo de material, número de personas que viven en ellas, etc. En los SIG modernos, la información de localización y la de atributos, es almacenada en archivos diferentes. Este proceso es totalmente invisible al usuario. El proceso de asignación de identificadores, es el que consume más tiempo en la generación de bases de datos. El tiempo invertido en el diseño al principio del proyecto ahorrará tiempo al final del mismo. En el proceso de asignación de identificadores, es necesario conocer el concepto de Diccionario de 43 NOTAS CLASE SIG I Datos el cual es un documento que define los atributos validos para un proyecto de digitalización, especificando el tipo de dato, los posibles valores, la definición de cada uno de ellos y su validez. Los códigos asignados como identificadores, deben, en los posible, cumplir con los estándares establecidos por el gobierno y por cada una de las instituciones que maneja determinado tipo de datos. Figura No. 332 Ejemplos de errores de digitalización señalados por un nodo final muerto En algunos casos, los valores de atributos son asignados a los rasgos, a medida que las mediciones geométricas son tomadas. Esto puede ser eficiente para rasgos de puntos y algunas clases de líneas. 44 NOTAS CLASE SIG I Si cada polígono es identificado por la digitalización de un solo punto dentro del polígono, la creación de la estructura topológica, adquiere la forma de chequear etiquetas. Todos los polígonos deberían tener uno y solo un punto “label” (etiqueta). Si el procesador topológico encuentra dos puntos dentro de una región, puede ser que los puntos o las líneas tienen error, tal como se muestra en la Figura No. 333. Típicamente, falta un arco, lo cual hace que se conecten dos polígonos que deberían estar separados, quedando como un solo polígono con dos label. Un polígono sin punto, puede señalar la omisión de un punto o señalar que alguna línea inadvertidamente dividió un polígono. Estos aspectos ayudan a que el operario sea dirigido para solucionar los problemas. Figura No. 333 Errores de digitalización detectados durante el etiquetamiento Una vez los datos pasan la prueba, se les puede certificar su “limpieza topológica”, significando que el software puede depender de la estructura de los datos. Las pruebas topológicas de la consistencia 45 NOTAS CLASE SIG I lógica están particularmente bien desarrolladas en la generación actual de paquetes SIG. En forma similar a otras pruebas lógicas, las pruebas topológicas usan la base de datos que está almacenada en el sistema, sin fuentes externas de información. Un programa serio de control de calidad debe usar las pruebas topológicas como un principio necesario, pero ellas no son suficientes para realizar el control de calidad. 6.1.2 Otras pruebas de calidad de datos Junto con las pruebas topológicas, debería haber consideraciones para los otros componentes de calidad de datos. Por ejemplo, algunas formas de evidencia interna pueden ser usadas para validar el rango de valores asignado a un atributo. Una prueba tal, realmente no verifica el valor específico para un objeto particular, sino que localiza equivocaciones potenciales en todos los componentes. Pruebas más detalladas de exactitud posicional, completitud y exactitud de atributos requieren alguna fuente de información externa. Una fuente de datos puede ser la base de datos de exactitud más alta que existe para una parte de la región, un programa de trabajo de campo u otras estrategias. Los procedimientos para probar información geográfica son un área de sustancial interés de investigación. Puntos de muestras son usualmente empleados para corroborar la exactitud de los resultados de los procedimientos de clasificación de sensores remotos. El proceso de superposición puede ser empleado para probar una cobertura contra otra. En ambos casos, las diferencias deben considerarse con respecto a la resolución espacial deseada para los dos productos. Cualquier programa de prueba es costoso y debe ser diseñado cuidadosamente. La digitalización, a primera vista, está limitada por el material fuente. Los resultados nunca se verán mejor que la calidad de los mapas originales. Ciertamente la dificultad de digitalizar es incrementada por errores e inconsistencias en los mapas. Sin embargo, el proceso de conversión es más que la versión digital de una máquina de copia. La calidad de los mapas puede ser mejorada imponiendo un conjunto estricto de restricciones de integridad y relaciones. La representación digital fuerza a que ciertas relaciones sean más obvias y requieran mayor consistencia. La era de la computación ha popularizado el dicho “Basura entra, basura sale”. Mientras el computador permanezca como un repositorio pasivo, esto será verdad. Si el procesamiento impone un conjunto estricto de restricciones de integridad, el proceso de digitalización puede actualizar la representación del mapa de entrada, de tal forma que sea algo mejorada. 7 DESPUES DE LA DIGITALIZACION Después de la digitalización del material fuente, el resultado podría no corresponder exactamente a los requerimientos. Otros procesos se necesitarán entonces para completar la construcción de la base de datos. Por ejemplo, una tarea comprende la construcción de las coberturas mayores, a partir de las planchas digitalizadas en forma separada. Otras usan cambios de escala, geocodificación y transformaciones temporales, que se relacionan directamente con el proceso de digitalización. 7.1 Generalización y cambio de escala. A pesar de las protestas de los cartógrafos, las fuentes de datos son descritas todavía en términos tradicionales por una fracción representativa ósea por la escala cartográfica. Por ejemplo se pueden encontrar en el mundo productos descritos como 1:24.000, 1:100.000 ó 1:2.000.000. cuando ellos son producidos por digitalización de los productos gráficos, esto en cierta forma tiene sentido, pero hay que considerar las reglas usadas por la agencia en particular, que los produce. Por ejemplo la serie de los 1:100.000, puede ser producida por 46 NOTAS CLASE SIG I foto reducción de la serie 1:24.000 y la documentación de esta historia no siempre se lleva a cabo. Los DEM (modelos digitales de elevación) producidos por el servicio geológico de los Estados Unidos, son descritos a escalas 1:24.000, pero pocos de ellos son producidos a partir de los contornos del producto gráfico, pues la mayoría son producidos independientemente por muestreos de 30 metros sobre fotografías aéreas. La densidad de muestreo proveería una más clara descripción de esos productos (más que la misma escala). La escala incluso llega a ser un indicativo irrelevante para nuevas fuentes de datos, las cuales pueden ser creadas directamente por compilación fotogramétrica sin usar ningún producto gráfico tradicional. La escala ha sido como una serie de taquigrafía para un gran número de decisiones. Cuando son restringidas al medio gráfico, las escalas mas detalladas típicamente implican mayor exactitud; sin embargo esta relación no es obligatoria, pues la calidad de ciertos mapas no corresponde con la escala. Estos mapas detallados podrán estar desactualizados por ejemplo en 30 años y si su uso es para generar las propiedades de los estratos socioeconómicos, es grave que esas fuentes sean ambiguas, siendo distorsionada la información. La información de escalas detalladas debe ser mas actualizada y más exacta en algunos aspectos. En conclusión las reglas cartográficas asumidas por la escala incluyen muchos tópicos de medición de los atributos e integridad, a lo largo con las relaciones geométricas. Muchas técnicas cartográficas pueden ser aplicadas para reducir la cantidad de datos. Esto es lo que se denomina generalización. Hoy en día existen muchas técnicas de generalización automática de mapas. Una de esas herramientas mas frecuentemente usada es el algoritmo de reducción de líneas de Douglas y Peucker, 1973. Este algoritmo trabaja línea a línea, asumiendo que los puntos de los extremos son requeridos. En cada paso, una línea de tendencia es construida entre los dos últimos puntos definidos como los requeridos. Los demás puntos entre estos dos, son examinados para establecer la máxima desviación a partir de la tendencia. Si esta desviación excede alguna tolerancia, el punto de mayor desviación es seleccionado y dos líneas más de tendencia son creadas. Ver figura No. 34. Este algoritmo de reducción del numero de puntos a lo largo de una línea no es el más rápido, ya que debe encontrar la máxima desviación desde cada línea de tendencia. Existen filtros más simples que pueden “limpiar” puntos cercanos con menos cómputos. Sin embargo esa limpieza puede traer diversos errores topológicos, debido a la deformación de las geometrías a unas nuevas. Ver Figura No. 35 Cualquier técnica de reducción de líneas fallará, si se extiende mas allá del propósito perseguido. El algoritmo de Douglas y Peucker trabaja línea a línea y por eso no altera la topología fundamental; sin embargo, algunas situaciones pueden requerir remover objetos completos para realizar cambios radicales en las escalas. La reducción de líneas no da como resultado la remoción de objetos completos o la fusión de ellos con sus vecinos. 7.1.1 Vinculando Atributos por geocodif icación. 47 NOTAS CLASE SIG I Otro método para generar nuevas representaciones es el de vincular atributos a los objetos existentes a través de mediciones indirectas. Por ejemplo, un hospital tiene registros de los pacientes con una enfermedad particular, para examinar las causas ambientales de esta enfermedad, la ubicación de la casa de cada paciente, es necesario localizarla sobre un mapa digital. Esta localización puede ser asignada indirectamente, usando un procesamiento de los datos tabulares existentes en el hospital. Estos datos deben ser agregados por ciudad o por código postal aplicando un marco de medición de coropletas. Figura No. 34 Generalización de líneas. Algoritmos Douglas y Peucker, 1973 48 NOTAS CLASE SIG I A un nivel mas detallado, la dirección de la calle provee un sistema de referencia espacial. Hacer casar las direcciones, consistiría en convertir la dirección de cada paciente a coordenadas. El método para hacerlas casar varía dependiendo de las reglas que aplican las direcciones en varios países e incluso regiones. Por ejemplo la numeración de las casas puede ser con números pares e impares, para los lados opuestos de la calle. En algunos sitios se registra el nombre de las calles y el rango de direcciones a cada lado. Así un numero de casa podría ser interpolado en este rango. Figura No. 35 Generalización de líneas por remoción de puntos 49 NOTAS CLASE SIG I Mas allá de los detalles del sistema de direcciones especifico, el hacer casar las direcciones representa un conjunto general de transformaciones orientadas a redes. La segmentación dinámica vincula información de vías rápidas a una posición medida a lo largo de la ruta y de igual forma información hidrológica, puede ser vinculada a un sistema de referencia de un río. Cada uno de estos procedimientos lo que hace es vincular nuevos atributos a objetos que ya existen en la base de datos. Estas técnicas pueden ser usadas en lugar de digitalizar. 7.1.2 Actualizaciones temporales y cambios Quizá el componente mas débil en el manejo de datos geográficos es el tiempo. Si una fuente de información existente falla en satisfacer los requerimientos debido a que está desactualizada, entonces un proceso de actualización puede ser mas efectivo que una reconstrucción total. Algunas actualizaciones pueden efectuarse usando fotografías aéreas u otras imágenes, a través de la interpretación visual de las diferencias. Existen muchas técnicas para la detección de cambios. Si el cambio es definido como una diferencia en dos instantes, entonces es difícil separarlo del error en las fuentes. Un enfoque más directo busca las fuentes de información que registran los cambios directamente. Por ejemplo un análisis de expansión urbana puede usar los permisos de construcción como las imágenes para localizar nuevas construcciones residenciales. Las técnicas del SIG ofrecen muchas posibilidades para mejorar el tratamiento del tiempo y del cambio. El método de representación ya no esta atado a la distribución masiva de productos impresos estandarizados. Una base de datos computarizada debe ser diseñada para mantener el registro histórico, como la evolución de la información. Las aplicaciones científicas requieren información temporal para estudios de procesos y procedimientos legales. Todavía el estado actual de la tecnología presenta un gran riesgo debido a los marcos limitados para la representación, el tiempo no se puede manejar fácilmente. La historia de los cambios que se realizan a la base de datos desaparece cuando se da el comando borrar, dejando menos rastros que en la era de los mapas de papel. 7.2 Otros tópicos importantes de la calidad de los datos El creciente interés por la calidad de fuentes de datos de un SIG es común entre los especialistas de ahora. La calidad y disponibilidad de productos SIG debe ser evaluada cuidadosamente, debido a la manipulación de datos espaciales por parte de las instituciones privadas, la aplicación acelerada de los software SIG y el actual papel que desempeñan en la toma de decisiones. Actualmente existe un gran interés en cuanto al error inherente a las metodologías de SIG. Aunque se esta llevando a cabo mucha investigación al respecto, el mercado de datos SIG continua, razón por la cual es necesario realizar algunas consideraciones practicas para de esta forma identificar los posibles errores y definir la calidad de los datos involucrados en un SIG. 50 NOTAS CLASE SIG I 7.2.1 Elementos de la calidad de datos Los conceptos de exactitud, precisión y error son importantes para poder determinar esta calidad. La exactitud evalúa la cercanía de los resultados de observaciones con respecto a los valores que se conocen como verdaderos. Esto implica que las observaciones de la mayoría de los fenómenos espaciales sean considerados para estimar el valor verdadero. La diferencia entre los datos observados y los verdaderos indica la exactitud de las observaciones. Existen dos tipos de exactitud: La exactitud posicional y la exactitud de atributos. La exactitud posicional es la desviación esperada en la ubicación geográfica de un objeto, con respecto a su posición en el terreno. Hay dos componentes en la exactitud posicional: La relativa y la absoluta. La exactitud absoluta concierne con la exactitud de elementos de datos con respecto a un sistema coordenado especifico; p.e. Proyección transversa de Gauss. La exactitud relativa concierne a la posición de dos coberturas, una con respecto a la otra. La exactitud relativa frecuentemente es de mayor interés que la exactitud absoluta. Por ejemplo, la mayoría de usuarios de SIG no pueden vivir con el hecho que las coordenadas de un municipio no coinciden exactamente con las coordenadas de los sitios de una encuesta. La exactitud de los atributos es igualmente importante pues también refleja la estimación de la verdad, pero sobre las características de los elementos representados espacialmente. Por ejemplo al interpretar y retratar los linderos y las características de un bosque, las posiciones pueden haber sido definidas de forma complicada y subjetiva. Además el grado de homogeneidad que se pudo haber encontrado en una unidad, probablemente no se aproxima lo suficiente a la realidad como podría desearse por parte de varios especialistas. La calidad puede simplemente ser definida como la aptitud de uso de unos datos específicos. Los datos apropiados para una aplicación, pueden no ser útiles para otra. Esto dependerá de la escala, la exactitud y el tipo de datos. Los datos de transferencia espacial de USA (SDTS), identifican cinco componentes de calidad de datos: El linaje, la exactitud posicional, la exactitud de atributos, la consistencia lógica y la integridad. El linaje, se refiere a la historia de los datos, es decir a los aspectos de compilación, tales como la fuente, el contenido, las especificaciones de captura, la cobertura geográfica, el método de compilación, los métodos de transformación que se aplicaron a los datos y el uso de unos algoritmos pertinentes durante la compilación, por ejemplo. lineal, la simplificación, generalización, entre otros. La exactitud posicional es importante e incluye la consideración del error inherente (error de fuente) y el error operacional (introducción del error). 51 NOTAS CLASE SIG I La exactitud de atributos también ayuda a definir la calidad de los datos. Esta calidad se refiere a la identificación de la confiabilidad, o al nivel de pureza (homogeneidad) en los datos que se utilizaron. La consistencia de la lógica determina la fidelidad de los datos, la estructura de los datos que se utilizaron de tal forma que no se tengan inconsecuencias espaciales, tales como intersecciones de líneas incorrectas, duplicación de líneas o linderos, entre otros. Estas ultimas constituyen errores topológicos o errores espaciales. La integridad muestra que tan complejos son los datos. Esto incluye consideración de “huecos de los datos”: áreas no clasificadas, zonas con nubes y cualquier procedimiento de compilación que pueda haber ocasionado eliminación de datos. La facilidad de que los datos geográficos en un SIG puedan usarse a cualquier escala, destaca la importancia de la calidad de información de los datos. Aunque en los SIG la escala puede ser manipulada, la base de datos se producen con unos niveles de exactitud y una resolución asignada a ciertas escalas. 7.2.2 Fuentes de error de la información Geográf ica. Existen dos fuentes de error: Uno inherente y otro operacional, los cuales contribuyen a la reducción en la calidad de los productos que son generados por los sistemas de información geográfica. El error inherente es el error que se presenta en datos y documentos fuente. El error operacional es la cantidad de error producido mediante la captura de datos y la manipulación de las funciones del SIG. Las fuentes de errores operacionales incluyen: Mala colocación de los labels sobre mapas temáticos; mala colocación de los linderos y bordes; error humano al digitalizar; errores de clasificación; inexactitudes algoritmicas en SIG y predisposición humana. Aunque el error existirá siempre en cualquier proceso científico, en un SIG se debe estar atento a identificar el error existente en las fuentes de datos y a minimizar la cantidad de error agregado durante su procesamiento. Debido a las limitaciones de costo lo que se hace frecuentemente es tratar de administrar el error antes que eliminarlo. Es casi igualmente costoso reducir el nivel de error en una base de datos que crear y mantener la base de datos. La conciencia de la condición de error en los diferentes conjuntos de datos, permitirá que el usuario haga una declaración subjetiva sobre la calidad y confiabilidad de un producto derivado de un SIG. La validez de cualquier decisión con base en un producto de SIG, dependerá de la calidad y la confiabilidad del producto. El depender del nivel de error inherente en los datos fuente y el error operacional ocasionado mediante la captura y manipulación de datos, hace que los productos SIG puedan tener cantidades significativas de error. Uno de los problemas importantes que actualmente existe dentro de los SIG es el de la circulación de datos geográficos digitales. Frecuentemente se cree que como los datos en SIG 52 NOTAS CLASE SIG I pueden ser producidos de manera muy precisa, son igualmente muy exactos. Pero por ejemplo, en el manejo de los datos a una escala 1:20000, generalmente la exactitud posicional mostrara una zona de error alrededor del punto +/-20 m. Considerando que el uso de SIG involucra la integración de varias coberturas de datos, comúnmente a escalas diferentes es posible ver como los errores pueden ser fácilmente propagados durante el procesamiento. En resumen se tiene lo siguiente: ü Hay una necesidad creciente de documentación de errores para datos procesados por los sistemas de información geográfica. ü La integración de datos desde formatos diferentes (p. ej. puntos, líneas y áreas) y a diferentes escalas que poseen errores inherentes pueden generar productos de discutible exactitud. ü La exactitud de un producto derivado de SIG depende de las características inherentes a los productos fuente y a los requerimientos del usuario, tales como la escala de los productos de salida, el método y la resolución de la modificación de los datos. ü La mayor exactitud de cualquier producto de SIG, será la menor exactitud de la cobertura involucrada en el análisis. ü A medida que el numero de capas en un análisis aumenta, el numero de oportunidades de error también aumenta. 7.2.3 Infraestructura colombiana de datos espaciales (ICDE) En todo el mundo existen infraestructuras de datos espaciales, las cuales pueden ser de diferentes niveles: globales, regionales y locales. La de Colombia se denomina ICDE, la cual se basa en el reconocimiento del valor de la información y de su importancia para el desarrollo social y económico de la nación. Esta infraestructura reconoce el valor de los datos para construir políticas, a sabiendas de que su conocimiento permitirá generar información útil para el manejo más adecuado de los recursos de la nación. La ICDE pretende terminar con los problemas de datos incompletos, heterogéneos, que no pueden integrarse y que no pueden transferirse fácilmente, ni ser accedidos por los usuarios. El desarrollo descoordinado de bases de datos, no es bueno para la sociedad. Una Infraestructura de datos espaciales es un conjunto de políticas, tecnologías, estándares y recursos humanos, necesarios para adquirir, procesar, almacenar, distribuir y mejorar el uso de los datos geoespaciales. La iniciativa colombiana de ICDE esta impulsada por el IGAC, DANE, INGEOMINAS, IDEAM, Min del Medio Ambiente, ECOPETROL y Otros; los cuales conformaron un comité interinstitucional a finales de 1998. Actualmente esta en una etapa de gestión. Dentro del comité se abordan temas relacionados con: datos, escalas, estándares y espacios a alto nivel para traducir políticas en planes. En la parte de estándares el comité icontec – 0034 trabaja desde 1997, con una participación de cerca de 30 entidades colombianas, donde se han definido normas valiosas, referentes a los siguientes temas: 53 NOTAS CLASE SIG I ü ü ü ü ü Metadatos geográficos: documentación de los datos, cuyo resultado es la norma NTC-4611 Calidad de la información geográfica (cuyo resultado es el proyecto de norma técnica colombiana sobre la calidad de la información geográfica y cuya fuente es el comité de trabajo ISO/TC 211 norma 517 de 1998.) El catalogo de objetos geográficos básicos para la creación de nuevos datos (de esta forma las entidades dejan de ser productores autónomos, pensando en las necesidades de los usuarios y pensando que requiere ese usuario para reacomodar los datos) Terminología (conceptos y elementos básicos de la información geográfica es decir, lenguaje común) Posicionamiento global 7.2.3.1 Estándares Son un acuerdo libre y voluntario entre varias partes, respecto a especificaciones o procedimientos en general. Son entonces, normas que pueden ser originadas como un hecho (estándares de “facto”), como en el caso de Microsoft Office. Pueden ser de “jure” cuando existe una entidad que tiene autoridad para hacerlo, por ejemplo ISO o en Colombia Icontec. Existen iniciativas internacionales como el Open GIS (1995), conformado por productores de sotfware, entidades gubernamentales, organizaciones académicas o de investigación, proveedores de servicios y otros. Este consorcio se propone el acceso transparente a los datos y recursos de geoprocesamiento heterogéneos, en ambientes distribuidos. Así el uso de la información geográfica será para gente común y corriente, que requiere algo y puede tenerlo a través de internet. El acceso transparente a los datos se logra a través de la interoperabilidad. Las aplicaciones serán desarrolladas en tiempo real y no se requerirá ser especialista. Para más información consulte www.opengis.org Otras de las iniciativas es la ISO, donde el comité internacional ISO/TC 211 es el encargado de normalizar el tema de la información geográfica, trabajando las normas de la serie 15046, que son alrededor de 25. Su lema es obtener estándares de datos y servicios de información geográfica que garanticen la interoperabilidad, la cual es tenida como una meta. La serie de normas ISO 15046 se ocupa de los siguientes aspectos, entre otros: ü ü ü ü ü ü ü ü ü Modelo conceptual de la información geográfica expresado en lenguaje de alto nivel – UML Catalogo de objetos Documentación de datos (metadatos) Calidad de la información geográfica Servicios de posicionamiento Imágenes Armonización de terminología Certificación de personas Perfiles (subconjuntos de las certificaciones) 54 NOTAS CLASE SIG I En general la tecnología de la información ha ido por su lado, mientras que el SIG ha ido por el otro, el objetivo deberá ser volver esto una sola cosa, esa unión deberá promover datos y servicios. Los estándares más comunes hoy en día son los de exactitud de posicionamiento y los de exactitud temática. Para Colombia existe una resolución que es la No. 64 de 1994, por la cual se establecen las especificaciones mínimas que deben cumplir las personas naturales o jurídicas para realizar trabajos fotogramétricos y cartográficos en Colombia. Esas normas y las de los otros estándares usados a nivel mundial, pueden apreciarse en la Tabla No 6. 55 Guía de estudio para el tema Calidad de la Información Geográfica ESTÁNDARES USADOS PARA ERRORES DE POSICIONAMIENTO Y EXACTITUD TEMÁTICA NOMBRE DEL ESTÁNDAR Estándar Nacional de mapas de Estados Unidos (NMAS) PAÍS GENERALIDADES PLANIMETRÍA ALTIMETRÍA REPORTE USA 1947 Estándar de calidad mínima (define error máximo de posicionamiento). Nivel de probabilidad asociada del 90% Para escala de 1: 20.000 y mayores el error máximo es de 0.85 mm. a la escala del mapa. Para escalas menores a 1:20.000 es de 0.50 mm a la escala del mapa. Valor límite de error: CMAS = 2.146 * EMCircular Para cualquier escala el error máximo es de medio intervalo de curva de nivel. Si las curvas están cada 25 m, entonces el error máximo es de 12.25 m. Valor límite de error: VMAS = 1.645 * EMCz Después de comparados los valores límites de error con 0.85, 0.5 ó el intervalo medio de curva, con el 90% de confiabilidad: El mapa no cumple ó sí cumple el estándar NMAS Error admisible de medio intervalo de curva de nivel. Después de comparados los valores límites de error con 0.30 ó el intervalo medio de curva: El mapa no cumple ó sí cumple el estándar IGAC La calidad del mapa se reporta mediante etiquetas: Se compiló para cumplir el estándar ASPRS clase 1, 2 ó 3. Cumple el estándar ASPRS de tal clase. Debe reportarse en el 95% de confiabilidad, con una etiqueta indicando claramente que se evaluó y tiene un error NSSDA de tanto. EMCircular=((EMCx + EMCy) / 2) n EMCx = IGAC Colombia 1994 Estándar de la asociación americana de fotogrametría y Percepción Remota (ASPRS). Estándar de exactitud de posición de datos geográficos NSSDA USA 1990 USA 1998 Estándar de exactitud temática del USGS (servicio geológico de los Estados Unifod) Beatriz E. Alzate Atehortúa También de calidad mínima. La resolución 64 . Nivel de probabilidad asociada del 90%. Es el mismo para cualquier escala. No estipula como se calcula el valor límite de error Establece tolerancias de exactitud para mapas a escala 1:20.000 o mayores. Usa como medida el EMC. Establece tres clases diferentes de mapas No define valores límites y aplica a todo tipo de datos espaciales. Usa el EMC. Exige que se comparen los valores de las coordenadas en los datos y en el terreno para un mínimo de 20 puntos por cada conjunto de datos. La exactitud está asociada con una probabilidad del 95% . Es de tipo estándares de metadatos. Establece dos condiciones para el porcentaje de clasificación correcta PCC y para el índice de KIA (considera errores debido al azar) − ∑ ( Xi − X ) 2 i =1 n El EMC correspondiente es 0.30 mm a la escala del mapa. Para posicionamiento de planos para digitalizar el error máximo es de 1 mm. a la escala del mapa. Se evalúa por separado la exactitud por X y por Y. Los valores límites del error EMC por X y por Y son: Clase 1: 0.25 mm a la escala del mapa Clase 2: 0.50 mm a la escala del mapa Clase 3: 0.75 mm a la escala del mapa El error planimétrico se reporta de acuerdo con la fórmula: Exactitudh = 2.4477* ((EMCx + EMCy)/ 2) El error EMC para Z es: Clase 1: 1/3 del intervalo de curvas Clase 2: 2/3 del intervalo de curvas Clase 3: 3/3 del intervalo de curvas El error de altitud se reporta de acuerdo con la expresión: Exactitudv = 1.96 * EMCz La calidad temática es Acertada si PCC >=90% y KIA >= 85% Página - 1-