CURSO Fundamentos de Sistemas de Información Geográfica Grupo SIG UNIDAD 2 Datos geográficos y métodos de almacenamiento Tema 2 Modelos y estructuras de datos CIAF Centro de Investigación y Desarrollo en Información Geográfica BOGOTÁ , D. C. Modelos y estructuras de datos En función del modelo de datos implementado en cada sistema, podemos distinguir tres modelos de Sistemas de Información Geográfica: vectoriales, raster y datos orientados a objetos. Modelos de datos La base de datos espacial de un SIG no es más que un modelo del mundo real, una representación digital con base en objetos discretos. Una base de datos espacial es una colección de datos referenciados en el espacio que actúa como un modelo de la realidad (NCGIA, 1990). Las reglas según las cuales se modeliza el mundo real por medio de objetos discretos constituyen el modelo de datos. Modelo de datos vector Son aquellos Sistemas de Información Geográfica que utilizan vectores definidos por pares de coordenadas relativas a algún sistema cartográfico para la descripción de los objetos geográficos. Es importante aclarar que “modelo de datos” hace referencia a la conceptualización del espacio y “estructura de datos” se refiere a la implementación de esa conceptualización. El modelo de datos define la manera en que se van a representar las características espaciales en un SIG. Así, los tipos de modelos son: modelo vector y modelo raster. Figura 1. Fuente: http://www.aulati.net/wp-content/ uploads/2009/04/capas-raster-vectorial.jpg Por tanto, el modelo vectorial focaliza su interés en las entidades, en su posicionamiento sobre el espacio. Para modelizar las entidades del mundo real se utilizan tres tipos de objetos espaciales: puntos, líneas y polígonos (áreas); por ejemplo, un lago puede representarse por medio de un polígono. Así, los objetos no son más que representaciones digitales de las entidades, las cuales no siempre son elementos visibles; por ejemplo, las divisiones administrativas o censales. Geometría de los objetos El modelo de datos vector usa el sistema de coordenadas X,Y y emplea representaciones geométricas de punto, línea y polígono de acuerdo con el número de dimensiones y sus propiedades (tabla 1), así: Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados. Prohibida su reproducción para fines no académicos o de investigación. Tabla 1. Geometría de los objetos. Geometría Descripción Punto Figura 2. Yacimientos mineros. Tiene dimensión cero (0) y la propiedad de la posición. Un punto puede representar pozos, postes de energía, entre otros. La figura 2 representa los principales yacimientos mineros en la zona rural del municipio. Tradicionalmente, los datos adimensionales son tratados sobre coordenadas de dos ejes (x,y), pero en el caso de los pozos y las mediciones subterráneas que aportan datos sísmicos, que involucran tercera dimensión, su referencia al eje z se maneja como un atributo más. Sin embargo, ahora es posible su manipulación efectiva en 3D gracias a las nuevas tecnologías de modelamiento espacial y software que permiten su representación. Es importante reconocer que la estabilidad de objetos puntuales está relacionada con la escala de trabajo, ya que un punto en escala pequeña puede representar un área en escalas mayores. Así, por ejemplo, lo que en un mapa puede reconocerse puntualmente como un coliseo, en otro de mayor escala corresponde a un área circular. En la literatura SIG, un punto puede ser llamado nodo o vértice (Laurini y Thompson 1992). Línea Figura 3. Transporte nacional. Fuente: Visor de Mapas IGAC. http://ssiglapp.igac.gov.co:8080/limites/arcexplorer. html?origid=ESRI_World&server=http%3A//ssiglims. igac.gov.co&service=Catastro&usesession=true&windo wTitle=Catastro Tiene una dimensión y la propiedad de la longitud. Una línea puede representar, caminos, ríos, líneas de conducción eléctrica, túneles, entre otros. La figura 3 representa la cobertura vial nacional. Los datos lineales también cambian de naturaleza con la escala. Así, la línea que representa una avenida a cierta escala puede ser representada como un dato bidimensional o de área en una escala mayor. Polígono: tiene dos dimensiones y las propiedades de área y perímetro. Un polígono puede representar cuerpos de agua, parcelas. La figura 4 representa los cuerpos de agua en Barranquilla. Figura 4. Cobertura cuerpos de agua. Fuente: http://ssiglims.igac.gov.co/ssigl/mapas_de_ colombia/Estaticos/0302006000000000000200.html Polígono Figura 5. Ejemplos de polígonos. Fuente: Imagen original tomada de: http://www.mirabolivia.com/muestra_img.php?id_ imgbol=257&pag=2 Los polígonos a su vez pueden ser: • Polígono aislados: cuando el límite del polígono no es contiguo a ningún otro polígono. • Polígono adyacente: cuando se comparte parcialmente el límite del polígono con otro o varios polígonos. • Polígono Isla o Incluido: cuando un polígono está totalmente dentro de otro. La imagen 4, evidencia gráficamente los anteriores tipos de polígonos. Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados. Prohibida su reproducción para fines no académicos o de investigación. Volumétricos Los datos de volumen generan la representación de objetos o sucesos tridimensionales. Son ejemplos el relieve, las masas de aire, etc. La aproximación más frecuente de la tecnología actual para representar la tercera dimensión es mediante modelos digitales de elevación o DEM, que describen el volumen mediante la superficie que delimita los objetos (figura 6). Figura 6. Ejemplo datos volumétricos. Fuente: http://www.scielo.org.ar/img/revistas/raga/v64n2/a04f4.gif Figura 7. Ejemplo de datos raster. Modelo de datos raster A diferencia del modelo de datos vector, en el que la unidad de almacenamiento es el punto, en el modelo de datos raster el área de estudio es subdividida en cuadrículas regulares (celdas) para representar la parte más pequeña de la superficie de la Tierra (Kang-tsung Chang, 2004). A continuación se verán con mayor detalle las diferencias entre ambos modelos, conociendo sus ventajas y desventajas (tabla 2). Modelo de datos vector • • • Ventajas • • • • En cuanto al concepto, son ideales para representar variables discretas. Genera una estructura de datos más compacta que el modelo raster. Genera una codificación eficiente de la topología y, consecuentemente, una implementación más eficiente de las operaciones que requieren información topológica, como el análisis de redes. El modelo vectorial es más adecuado para generar salidas gráficas. Mejores estimaciones de área, perímetro y longitud. Se pueden adaptar bajo bases de datos orientadas a objetos. Análisis de redes más consistentes. • • Desventajas Es una estructura de datos más compleja que el modelo raster. Las operaciones de superposición de mapas son más difíciles de implementar. • Resulta poco eficiente cuando la variación espacial de los datos es muy alta. • El tratamiento y realce de las imágenes digitales no puede ser realizado de manera eficiente en el formato vectorial. • Las superposiciones exigen más verificación de errores y pueden ser más lentas. Modelo de datos raster • En cuanto al concepto, son ideales para representar variables continuas. • Es una estructura de datos simple. • Las operaciones de superposición de mapas se implementan de forma más rápida y eficiente. • Cuando la variación espacial de los datos es muy alta, el formato raster es una forma más eficiente de representación. • El formato raster es requerido para un eficiente tratamiento y realce de las imágenes digitales. • La diferente topología de las unidades espaciales dificulta los ejercicios de simulación. • Útil para análisis de grandes extensiones con baja precisión de propiedades espaciales. • • • • • La estructura de datos raster es menos compacta. Ciertas relaciones topológicas son más difíciles de representar. La salida de gráficos resulta menos estética. Alto nivel de error en estimaciones de área, perímetro y longitud. Gran espacio de almacenamiento a medida que aumenta la resolución. • Desperdicio de espacio de almacenamiento para datos espaciales esparcidos. • Análisis de redes muy complejos y menos consistentes. • Transformación de coordenadas menos eficiente. Fuente: Gutiérrez y Gould 1994. Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados. Prohibida su reproducción para fines no académicos o de investigación. Estructura de datos Estructura de datos vector Estructura de datos espagueti: para cada objeto espacial se registra su identificador, seguido por una lista de coordenadas de los vértices (puntos) que definen su posición en el espacio. Diccionario de vértices: un mapa se representa mediante dos archivos de datos: Un archivo está constituido por una relación de vértices, en la que constan las coordenadas X,Y, y otro archivo con los vértices que definen cada objeto. Esta estructura resuelve los problemas de repetición de coordenadas de los puntos, de la estructura espagueti; pero es muy pobre desde el punto de vista topológico. Estructura arco–nodo: el elemento fundamental es el arco. Donde el arco es una sucesión de líneas a segmentos que comienza en un nodo y termina en otro. Los nodos se marcan donde se produce la intersección entre líneas o donde una línea termina. En esta estructura se utilizan diferentes tablas para el registro de las relaciones topológicas: tabla para topología de polígonos, tabla de topología de nodos, tabla de topología de arcos, tabla de coordenadas de arcos. Su inconveniente radica en que, después de cada actualización, se requiere reconstruir la topología, lo cual puede tomar mucho tiempo cuando el archivo es grande. TIN (Red Irregular de Triángulos): esta estructura se basa en la estructura arco–nodo, diseñada especialmente para representar la elevación del terreno, pero puede ser utilizada para representar la distribución espacial de cualquier variable continua. Se trata de una red de triángulos irregulares interconectados, en la que se registran las coordenadas (X, Y) de los nodos que definen los triángulos y el valor de la elevación (Z) de dichos nodos, así como la contigüidad de los triángulos. Estructura de datos raster Estructuras raster simples Enumeración exhaustiva: se trata de almacenar uno por uno el valor de cada celda, de acuerdo con la secuencia que se establezca, generalmente fila a fila, a partir de la celda superior izquierda. Codificación por grupos de longitud variable: la codificación no se hace valor a valor, sino por grupos de valores iguales seguidos, existen dos modalidades: modalidad estándar y modalidad de punto valor. Estructuras raster jerárquicas Una derivación de las estructuras convencionales para ordenar datos raster, la más conocida, es la de árboles cuaternarios (quadtrees). Se trata de operar en una misma capa con distintos tamaños de bloques o grupos de celdas, lo que significa trabajar con una resolución variable. Figura 8. Fuente: IGAC, notas de clase. Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados. Prohibida su reproducción para fines no académicos o de investigación.