Subido por patito chafa

SIG. sistema de informacion

Anuncio
NOTAS CLASE SIG I
CONTENIDO
1
INTRODUCCION ________________________________________________________3
2
BASES PARA LA REPRESENTACION _______________________________________3
2.1
Almacenamiento de datos en SIG _____________________________________________ 3
2.1.1
La relación entre el mundo real y los datos en un SIG __________________________________
2.1.1.1 Almacenamiento de números en el computador _____________________________________
2.1.1.2 Almacenamiento de caracteres en el computador____________________________________
2.1.1.3 Bases para la representación de los atributos en SIG _________________________________
2.1.2
Características de almacenamiento de datos dentro de los sistemas computarizados___________
2.2
Georreferencia ____________________________________________________________ 9
2.2.1
Sistemas coordenados _________________________________________________________
2.2.1.1 La Esfera Autálica __________________________________________________________
2.2.1.2 El elipsoide ________________________________________________________________
2.2.1.3 El Geoide (Geo, tierra; como)__________________________________________________
2.2.2
El uso de las coordenadas Geográficas _____________________________________________
2.2.2.1 Latitud. ___________________________________________________________________
2.2.2.2 Longitud.__________________________________________________________________
2.2.3
Los tipos de proyecciones cartográficas. ___________________________________________
2.2.3.1 Distancia __________________________________________________________________
2.2.3.2 Dirección__________________________________________________________________
2.2.3.3 Area _____________________________________________________________________
2.2.3.4 Factor de escala_____________________________________________________________
2.2.3.5 Clasificación de las proyecciones según sus propiedades_____________________________
2.2.3.6 Clasificación de proyecciones según su forma ____________________________________
2.2.3.7 Clasificación según su aspecto _________________________________________________
2.2.3.8 Proyección Conforme de Gauss Kruger.__________________________________________
2.2.3.9 Proyección Universal Transversa de Mercator. ____________________________________
3
3
5
7
8
8
10
11
11
12
12
13
13
14
14
15
15
15
15
15
16
16
17
MODELOS DE REPRESENTACION Y ESTRUCTURA DE DATOS ________________18
3.1
Formas básicas de modelamiento de datos ____________________________________ 18
3.1.1
Modelo vector________________________________________________________________
3.1.1.1 Representación de objetos aislados______________________________________________
3.1.1.2 Representación de objetos topológicos___________________________________________
3.1.2
Modelo raster ________________________________________________________________
3.1.3
Modelamiento con datos triangulados _____________________________________________
3.2
18
19
20
21
22
Implementación de modelos de representación_________________________________ 22
3.2.1
Modelamiento de superficies ____________________________________________________
3.2.1.1 Superficie raster ____________________________________________________________
3.2.1.2 Líneas de contorno __________________________________________________________
3.2.1.3 Redes irregulares trianguladas (TIN) ____________________________________________
3.2.2
Modelamiento de imágenes o datos de muestras _____________________________________
3.2.2.1 Conjuntos de datos raster _____________________________________________________
3.2.3
Modelado de rasgos discretos ____________________________________________________
3.2.3.1 Conjuntos de datos de rasgos __________________________________________________
3.2.3.2 Asociaciones Rasgos, redes y topología __________________________________________
3.2.3.3 Rasgos y Cartografía_________________________________________________________
22
23
23
24
24
25
27
27
28
29
1
NOTAS CLASE SIG I
4
CONVERSION DE DOCUMENTOS EXISTENTES (DIGITALIZACION) ___________ 32
4.1
Calcado Vector ___________________________________________________________34
4.2
“Scaners” raster __________________________________________________________35
4.2.1
4.2.2
4.2.3
4.2.4
4.3
La corrección Diferencial _______________________________________________________ 38
La corrección en Tiempo Real ___________________________________________________ 38
Corrección Diferencial Postprocesada _____________________________________________ 39
4.4
imágenes de satélite. _______________________________________________________39
4.5
Archivos que ya se encuentren en formato digital (vector o raster). ________________39
TRANSFORMACION DE MEDICIONES POR DIGITALIZACION A COORDENADAS 39
5.1
Registro _________________________________________________________________39
5.1.1
Transformaciones entre coordenadas de los puntos de control y unidades de digitalización ____
5.1.1.1 Transformación similar ______________________________________________________
5.1.1.2 Transformación fina (“affine”)_________________________________________________
5.1.1.3 Transformaciones más complejas_______________________________________________
5.1.2
Errores en las transformaciones __________________________________________________
6
40
40
40
41
41
5.2
Proyecciones______________________________________________________________41
5.3
Referencia a servicios Geodésicos ____________________________________________42
CALIDAD DE LOS DATOS _______________________________________________ 42
6.1
Verificación y control de calidad _____________________________________________43
6.1.1
6.1.2
7
36
36
37
37
Colección de datos de GPS __________________________________________________37
4.3.1
4.3.2
4.3.3
5
Consideraciones de la resolución: ________________________________________________
Escala y Exactitud ____________________________________________________________
Preparación del Mapa__________________________________________________________
Otras consideraciones__________________________________________________________
Edición de errores_____________________________________________________________ 43
Otras pruebas de calidad de datos ________________________________________________ 46
DESPUES DE LA DIGITALIZACION _______________________________________ 46
7.1
Generalización y cambio de escala. ___________________________________________46
7.1.1
7.1.2
7.2
Vinculando Atributos por geocodificación. _________________________________________ 47
Actualizaciones temporales y cambios_____________________________________________ 50
Otros tópicos importantes de la calidad de los datos _____________________________50
7.2.1
Elementos de la calidad de datos _________________________________________________
7.2.2
Fuentes de error de la información Geográfica. ______________________________________
7.2.3
Infraestructura colombiana de datos espaciales (ICDE)________________________________
7.2.3.1 Estándares_________________________________________________________________
2
51
52
53
54
NOTAS CLASE SIG I
UNIDAD 4. REPRESENTACIONES
1
INTRODUCCION
Las representaciones comprenden un símbolo actuando en el lugar de alguna entidad (elemento del
mundo real). Un sistema de representación puede optar por suprimir algunos detalles del mundo para
enfatizar otros. El más claro precedente para las representaciones geográficas envuelve los símbolos
gráficos usados en mapas tradicionales. Un mapa pobla un espacio pequeño con la representación de
un espacio grande, usando símbolos de mapas que están en el sitio de las cosas del mundo real. La
representación directa del espacio facilita muchos tipos de procesos visuales, pero la transformación a
un espacio más pequeño crea muchos dilemas. El simbolismo del mapa tradicional a menudo hace a
un marco de medición ajustarse a los límites técnicos de la reproducción gráfica; en lugar de actuar
como una representación flexible de la información geográfica, los símbolos llegan a ser confusos con
la medición. Este legado aún influencia la comprensión de la Información Geográfica.
Las representaciones digitales son menos directas, que los mapas, estructurando relaciones espaciales.
Los símbolos digitales son extremadamente simples, pero a pesar de esa simplicidad, las
representaciones digitales mejoran las altas capacidades de los mapas impresos.
Este capítulo repasa los elementos primitivos usados para representar los datos geográficos y después
describe los modelos de datos básicos y las estructuras de datos1 que organizan esas primitivas dentro
de representaciones útiles. La parte final describe los diferentes pasos usados para convertir fuentes
de datos a un SIG.
2
BASES PARA LA REPRESENTACION
2.1 Almacenamiento de datos en SIG2
Los computadores son la tecnología que permite el desarrollo de los SIG. Su papel consiste en
almacenar y manipular datos. Entender los elementos de almacenamiento de datos en un computador
permitirá al usuario de SIG, diseñar un almacenamiento óptimo para los diferentes tipos de datos.
Para entender la naturaleza de los datos almacenados en cualquier SIG, dos tópicos son importantes:
La relación entre los datos almacenados y el mundo real que ellos dibujan.
Las características del almacenamiento de datos dentro de los sistemas computarizados
2.1.1
La relación entre el mundo real y los datos en un SIG
El mundo real es infinitamente complejo y tal complejidad no puede ser dibujada o procesada dentro
de los límites de un sistema de computación normal. Los SIG representan el mundo a través de
objetos geométricos: puntos, líneas y áreas para el modelo vector y celdas para el modelo raster.
Esto puede ser ó no una descripción exacta de la realidad. En particular el modelo de punto, línea y
polígono utiliza objetos con la forma de sus bordes bien definida, lo cual no es frecuente encontrar en
el mundo real, donde los límites entre elementos son difusos o transicionales. Por ejemplo los
elementos como los humedales son usualmente dibujados en los mapas con bordes redondeados, a
1 Arreglo de las entidades de datos que permite la construcción de relaciones a través de las operaciones de software; implementación del modelo de datos
2 Tomado de: http://www.ncgia.ucsb.edu/education/curricula/giscc/units/u037/u037.html
3
NOTAS CLASE SIG I
pesar de que ellos tienen bordes pobremente definidos en la realidad. Así mismo son almacenados en
el SIG y estos son los datos que se emplean para llegar a la solución de problemas. Los datos en SIG
dan una visión simplificada del mundo real.
En un SIG los datos que representan el mundo real han sufrido alteración en por lo menos tres
aspectos:
Selección:
En SIG los aspectos seleccionados del mundo real (los que se consideran son importantes) son
incluidos en el modelo digital, Los otros aspectos no son considerados o no se les da la importancia
que muchas veces tienen, pero ellos pueden llegar a ser de gran influencia para el problema que se
está analizando.
Los usos probables de los datos serán decisivos para determinar cuales elementos serán incluidos. El
grupo responsable de la recolección de los datos tendrá la responsabilidad en un área particular y los
datos serán seleccionados para este propósito. Los usos posteriores de los mismos datos pueden ser
infructuosos, cuando los propósitos son diferentes a aquellos para los cuales se seleccionaron.
Representación:
Los objetos del mundo real, que son incluidos, deben estar representados por un objeto definido en el
programa SIG. Esto hace que esta representación no sea fiel y que se pierdan detalles y espacialidad.
Los objetos que están representados en un SIG tendrán bordes definidos, mientras que en la
naturaleza muchos de ellos no presentan formas exactas que delimiten su ubicación en el espacio.
El uso probable de los datos será nuevamente decisivo, para determinar la forma de representación.
En cualquier caso la escala estará definiendo los detalles de la representación.
Cuantificación:
Los sistemas computacionales generalmente almacenan datos numéricos, lo cual obliga a asignar
valores numéricos a las características del mundo real, que serán incluidas en el SIG. Un sistema de
computador almacena valores únicos o discretos. Esto puede representar fielmente ó no la continuidad
de los datos que existen en el mundo real.
La naturaleza de los datos es importante, ya que diferentes tipos de operaciones matemáticas pueden
ser realizadas con diferentes datos. Los valores numéricos pueden ser definidos con respecto a escalas
de medición nominal, ordinal, de intervalo o razón.
Bits:
La unidad de procesamiento más pequeña se denomina bit (Binary digIT). Cada bit puede tener uno
de dos valores. “On” (representado por el valor 1) y “off” (representado por el valor 0). Los bits son
agrupados en conjuntos de ocho, los cuales se denominan bytes.
Sistemas binarios:
Los computadores usan un sistema binario para almacenar los números. En un sistema binario las
únicas formas son 1 y 0.
Los sistemas binarios son explicados mejor por comparación con el sistema decimal que es más
familiar (un sistema decimal usa 10 formas). En un sistema decimal los dígitos 206 representan el
4
NOTAS CLASE SIG I
número que está conformado por 2 porciones de 102 más 0 porciones de 101 más 6 porciones de 100.
(Esto suma 206).
En un sistema binario los dígitos 101 representan el número 5, el cual está conformado por una
porción de 22, más 0 porciones de 21, más 1 porción de 20 . (22 es 4, 21 es 2, y 20 es 1, entonces el
número es 4+1=5).
La numeración de 1 hasta 10 en sistema decimal, llevada a sistema binario sería: 1, 10, 11, 100, 101,
110, 111, 1000, 1001, 1010.
Bytes:
Un byte de almacenamiento son 8 bits.
2.1.1.1
Almacenamiento de números en el computador
La mayoría de computadores proveen los siguientes formatos para números: entero, de punto flotante
y de doble precisión (Figura No. 1).
Figura No. 1 Almacenamiento en el computador usando los niveles básicos (bits, bytes,
palabras-entero, punto flotante y doble precisión)
5
NOTAS CLASE SIG I
La forma en que los datos numéricos son almacenados en el computador depende de la arquitectura
del computador, la cual a su vez depende del tipo de computador (personal o convencional) y su
modelo. El número de bits que el computador usa como unidad básica de almacenamiento varía. Los
siguientes son los tamaños que se pueden presentar:
16-bit(2-bytes) computadores personales (generación previa)
32-bit (4-bytes) computadores personales (generación actual)
64-bit (8-bytes) Ultima generación.
En esta época la mayoría de computadores almacena los valores enteros y de punto flotante en 32 bits
y los de doble precisión en 64 bits.
Los números enteros son los que no tienen decimales. El número 255 es el límite para un
almacenamiento de 8 bits, por que es el número binario 11111111 (ocho unos), esto equivale a: 1 (el
cual es 2°), más 2 (el cual es 2¹), más 4 (2²), más 8 (2³), más 16, más 32, más 64, mas 128. Este es
un rango de datos muy usado. Muchos de los datos en SIG caen en este rango. Por ejemplo: Las
unidades geológicas, forestales o de suelos, casi nunca sobrepasan las 255 unidades, por eso son de
tipo byte. Las imágenes de satélite también usan este tipo de almacenamiento (sus valores oscilan
entre 0 y 255).
Los datos enteros con valores mayores a 255, requieren más de un byte de almacenamiento para ser
guardados en un sistema de computador.
Los enteros de 32 bits pueden representar cualquier número entero de –2147483647 a 2147483648.
Con números enteros los resultados de cualquier división que envuelve un residuo será truncado a el
siguiente entero más bajo.
En SIG los datos en coordenadas UTM tendrán decimales. En sistemas estos son llamados datos de
punto flotante.
El punto flotante usa una notación logarítmica con un exponente para establecer la magnitud y la
mantisa, para el valor. Este formato provee cerca de seis dígitos decimales de mantisa, escalado sobre
un rango mucho mayor (típicamente –1036 a 1036). La doble precisión provee cerca de 15 dígitos,
esencialmente una forma extendida de punto flotante, pero el almacenamiento es el doble y la
velocidad de los cálculos es más alta. La selección entre esos formatos tiene consecuencias en el
manejo de la información geográfica.
Los computadores almacenan números negativos usando un bit de signo. El signo es usualmente el bit
de orden superior, que es el bit en la posición izquierda. Si este bit tiene valor de 1 es negativo el
número, si tiene valor de cero, el número es positivo. El programa le indica al procesador del
computador si el bit de orden superior tiene que ser tratado como un bit de signo o como parte del
número. Excepto los datos byte, los números son usualmente almacenados como datos de signo.
En general el almacenamiento de datos enteros tiene ventaja sobre los de punto flotante, pues los
flotantes requieren más espacio de almacenamiento que los enteros, ya que necesitan almacenar dos
números para un mismo valor. Así mismo los de punto flotante son más complejos para procesar.
Al seleccionar un tipo de almacenamiento de datos los usuarios deben considerar el uso que se le
quiere dar a los datos en SIG y el tipo de valores que requerirá para ser representado.
6
NOTAS CLASE SIG I
2.1.1.2
Almacenamiento de caracteres en el computador
El grupo de letras (textos) o caracteres son usualmente llamados “strings”. Su almacenamiento se
realiza de acuerdo con un sistema de codificación (por ejemplo códigos ASCII)
Los archivos de texto, constituyen otro manejo importante de los bytes. Para almacenar textos se usa
el sistema ASCII (American Standard Code for Information Interchange) de codificación.. Toda letra y
número en un teclado tiene un único código. Siete bits son usados para dar 127 números de código,
los cuales son asignados a cada tecla. (Las teclas en mayúscula y minúscula tienen diferentes
códigos). Allí hay también códigos para los caracteres especiales como Tabulaciones y Enter. (Ver
Tabla 1). Los 127 códigos ASCII básicos pueden ser extendidos usando 8 bit para dar un total de 255
códigos. Esos códigos “extra” incluyen caracteres internacionales. Actualmente el “16 bit caracter
internacional” permite introducir los “kanji” y los caracteres chinos.
Tabla 1 Códigos ASCII para varios caracteres del teclado
Caracter
(espacio)
!
"
#
$
%
&
'
(
)
Código ASCII
32
33
34
35
36
37
38
39
40
41
Caracter
0
1
2
3
4
5
6
7
8
9
Código ASCII
48
49
50
51
52
53
54
55
56
57
Los códigos ASCII son un estándar muy importante para la transferencia de datos.
La forma en que los datos numéricos son almacenados en un computador, depende de la arquitectura
del computador. Los datos creados sobre un tipo de computador no podrán ser interpretados por un
computador con diferente arquitectura. Los datos deben ser convertidos a ASCII antes de transferirlos
de un computador a otro con diferente arquitectura, ya que todos los computadores interpretan
correctamente los códigos ASCII.
La mayoría de programas SIG ofrecen opciones de exportación de datos, que producen archivos
ASCII. La desventaja de la codificación ASCII radica en que los archivos SIG son codificados de
manera más extensa utilizando esta opción.
Por ejemplo: el número 127 puede ser almacenado en formato binario en un byte (permite almacenar
números de cero a 255); mientras que en formato ASCII, se requeriría de un byte para el uno, un byte
para el 2 y un byte para el 7.
Los números pueden ser almacenados como carácter. Un número así almacenado estará comprendido
por una serie de caracteres. No es posible usar los números guardados como caracteres en
operaciones matemáticas.
Si un carácter incluye espacios, es necesario usar comilla (“ ó ‘) para indicar su extensión.
7
NOTAS CLASE SIG I
2.1.1.3
Bases para la representación de los atributos en SIG
Los valores de atributo en un sistema digital son directamente codificados usando las unidades de
almacenamiento del computador. La matriz geográfica cubre la estructura de datos de un arreglo bidimensional. Una localización de almacenamiento es asignada por cada valor de atributo. Los números
son habitualmente codificados como puntos flotantes, porque seis dígitos son adecuados para la
porción significativa de una medición de atributo. Los cálculos son habitualmente codificados como
enteros para hacer uso del rango incrementado, aunque un entero de 32 bit no es tan adecuado para
representar la suma de la población mundial.
Cuando el volumen de almacenamiento se convierte en preocupación, como con las imágenes de
satélite, las mediciones continuas deben ser reescaladas al rango de 0 a 255 y codificadas como un
entero en un byte. Muchos usuarios olvidan ese detalle y simplemente tratan un atributo como un
número. Ellos asumen que el computador puede manejar todas las operaciones aritméticas obvias. El
computador manipula las unidades de almacenamiento sin reconocer niveles diferentes de medición,
por lo tanto, lo válido de los cálculos depende del significado externo.
Los atributos nominales deben ser codificados como un tipo de número también. Las reglas de
codificación llegan a ser parte del esquema de la estructura de datos que debe ser preservado para
retener el significado de la información. Las categorías pueden ser codificadas en un solo byte sin
pérdida del contenido de la información, siempre y cuando haya solamente 256 posibilidades.
Los diferentes tipos de almacenamiento posibles para los atributos se presentan en la Tabla 2
2.1.2
Características de almacenamiento de datos dentro de los sistemas
computarizados
La siguiente terminología es comúnmente usada para describir las capacidades de almacenamiento de
varios dispositivos
K – Kilobyte o aproximadamente 1000 bytes
M – Megabytes o aproximadamente 1.000.000 de bytes
G – Gigabyte o aproximadamente 1.000.000.000 bytes
El diseño del SIG debe garantizar que la capacidad de almacenamiento sea usada eficientemente.
La precisión espacial es importante en SIG, por eso existe tanta demanda por parte de los paquetes en
cuanto al almacenamiento de datos espaciales . Para el almacenamiento de datos no espaciales como
los valores de celdas en el modelo raster ó los códigos de los polígonos en el modelo vector, el diseño
es importante y la mayoría de programas SIG son flexibles en cuanto a los tipos de almacenamiento
de estos datos.
El modelo raster para datos de SIG típicamente requiere más almacenamiento que el vector, debido al
gran número de celdas que deben ser almacenadas, entonces los tópicos de diseño deben ser más
cuidadosos para este modelo.
El diseño del almacenamiento de datos es importante por dos razones:
Los usuarios de SIG inevitablemente se encuentran con que cada vez los requerimientos para el
almacenamiento de datos son mayores y su desarrollo se hace paralelo con el aumento de la
capacidad de los dispositivos de almacenamiento. Por este motivo el uso eficiente del espacio
8
NOTAS CLASE SIG I
disponible es esencial. Cuando los datos son procesados deben ser leídos desde el dispositivo de
almacenamiento y después de procesados ser reescritos.
Leer y escribir los datos es usualmente la parte más lenta del procesamiento de datos. Si un diseño
pobre ha estipulado el uso de grandes cantidades de almacenamiento innecesarias, el tiempo de
procesamiento será lento, por tenerse que leer y escribir bytes de almacenamiento redundante.
Las características de diferentes tipos de almacenamiento de datos se presentan en la Tabla 2
Tabla 2 Resumen de tipos de almacenamiento de datos
Tipo
Byte3
Otros nombres
Char
8-bit
Entero
No entero
Numérico
Decimal
Flotante
Doble precisión
7.5
3.14159
6
402
200
-10
310
3.2
Ejemplo
(es muy grande, (No
debe
tener
6/2/1998
inválido(razón
pasa
de
255) valor
decimal)
(solo se
de
su
no- 2.1
27m
cifras)
validez)
(no
debe
tener (no debe haber
valores decimales) caracteres)
Ejemplos
Carácter
String
“Río azul”
Playas
blancas
(son
requeridas
permiten comillas
con
palabras que tienen
espacios)
En algunos software 4 byte (32 bits) es usado para almacenar datos enteros. Para el almacenamiento
de datos no enteros es usado 8 byte (64 bits), por ejemplo para almacenar datos de coordenadas en
algunos software vector.
2.2 Georreferencia
La representación del espacio requiere un sistema de referencia espacial. En un mapa la localización es
codificada por la posición relativa sobre el papel. En una base de datos computacional la localización
está basada en la geometría analítica. Para propósitos prácticos el componente espacial de la
información geográfica está representado en forma de coordenadas, ósea mediciones ordenadas
dentro de un sistema de referencia espacial. Esas mediciones pueden ser ángulos en un elipsoide
(latitud, longitud) o distancias ortogonales sobre un plano de proyección. Hay diferentes formas de
codificar mediciones equivalentes, incluso sobre un mismo plano. Cada programa SIG implementará un
cierto rango de sistemas de referencia espacial alternativos, como representaciones específicas de las
posibilidades matemáticas.
Todos los sistemas
debido a que ellos
pueden representar
mayoría de líneas
de números soportados por los computadores tienen una resolución limitada,
son en esencia enteros. Cuando son usados para coordenadas, los enteros no
todas las localizaciones intermedias entre líneas diagonales (Figura No. 2). La
diagonales de un par de números enteros a otro par, pasan a través de
3
Los datos byte son usados frecuentemente para datos raster (especialmente en percepción Remota),
pero raramente son usados para datos vector.
9
NOTAS CLASE SIG I
localizaciones que no pueden ser representadas en el sistema entero, sin torcer los segmentos de línea
recta. En la figura puede ser observado que las líneas oscuras representan el resultado de la
intersección de dos líneas rectas una vez que han sido redondeadas a enteros las coordenadas.
Para evitar esos problemas los sistemas de representación de coordenadas deben tener una excesiva
resolución. El almacenamiento con enteros también produce que no haya representación de
coordenadas que puedan ofrecer variaciones continuas verdaderas. El tamaño de los saltos discretos
en la resolución puede hacerse muy pequeño, como para que parezcan continuos, pero solamente en
alguna medida.
Figura No. 2 Representación de localizaciones intermedias en un sistema de coordenadas
entero
La resolución tiene consecuencias para dar la extensión máxima del área representada. Con datos de
punto flotante podría representarse el circulo del ecuador en kilómetros, pero en metros esto no es
posible. A escala local esos datos pueden resolver centímetros, pero solo colocando el origen cerca al
área de interés. Por otra parte la resolución es desperdiciada midiendo cada coordenada relativa a un
origen distante.
Actualmente se ha optado por datos de doble precisión, a costa de una baja velocidad y un alto
volumen de almacenamiento. Con doble precisión hay suficiente resolución para distinguir cualquier
elemento del planeta. Para propósitos de cartografía esta resolución debe ser filtrada hasta un nivel
razonable. Sin embargo, es curioso usar tal almacenamiento para mediciones obtenidos a partir de
mapas inexactos y a partir de sistemas de digitalización que son falibles.
El análisis geográfico dentro de un SIG, involucra la integración de datos de diferentes fuentes. Los
datos espaciales, ya sean en formato vector o raster, pueden ser combinados únicamente si están
referenciados en términos relativos (con respecto a otro objeto) o en términos absolutos (con respecto
a una localización sobre la superficie de la tierra). Esto puede solucionarse utilizando un sistema
coordenado común.
2.2.1
Sistemas coordenados 4
Los aspectos referentes al sistema coordenado que debe conocer cualquier usuario de SIG, son los
siguientes:
ü
ü
ü
ü
4
Las diferencias entre el Geoide, Elipsoide y la esfera Autálica.
El uso de las coordenadas Geográficas
Los tipos de proyecciones cartográficas.
Los sistemas de Coordenadas planas.
Tomado de las notas de clase de la profesora Susana Barrera
10
NOTAS CLASE SIG I
ü Las formas en que se georreferencia la información en un SIG
ü La manera de realizar proyecciones de un sistema coordenado a otro.
2.2.1.1
La Esfera Autálica
Desde Pitágoras (Siglo V a. C), se tenía la concepción de que los humanos debían vivir en una forma
perfecta. Aunque en la actualidad conocemos que la tierra no es una esfera perfecta sino un elipsoide,
los cartógrafos aún utilizan la esfera conocida como esfera “Autálica” como base para sus mapas, la
cual tiene un radio de 6731 Km y una circunferencia de 40030,2 Km (WGS84 y Clarke).
La esfera Autálica es la superficie de referencia para mapas a escala pequeña tales como países,
continentes y grandes áreas. Esto se debe a que la diferencia entre la esfera y el elipsoide es mínima
al considerar grandes áreas. Para mapas a grandes escalas tales como mapas topográficos o cartas
náuticas es necesario considerar el elipsoide pues debe tenerse en cuenta el achatamiento de la tierra.
2.2.1.2
El elipsoide
Hasta el año 1600 la tierra se consideró una esfera perfecta, pero desde el año 1670, con la teoría de
la gravitación Universal de Newton, se concluyó que debía haber un achatamiento en los polos,
debido a la fuerza de gravedad generada por la rotación de la tierra. Newton, predijo que este
achatamiento debía ser del orden de 1/300. Desde 1735 y hasta 1743, se hicieron mediciones en el
ecuador y en Finlandia, construyendo así lo que conocemos como el elipsoide. El grado de
achatamiento del elipsoide se mide como:
Donde
a: radio ecuatorial
b: radio polar
El achatamiento, generalmente es expresado como 1/f. Los valores actuales se basan en medidas de
satélites y son del orden de 1/298. Ver Figura No. 3
Figura No. 3 Parámetros elipsoidales
Desde 1800 hasta nuestros días, por lo menos 20 determinaciones de elipsoides se han hecho,
tomadas desde varios sitios. Los cambios en los valores se deben a la precisión de los métodos
utilizados y a pequeñas variaciones en la curvatura
de continente y continente debido a
11
NOTAS CLASE SIG I
irregularidades en el campo gravitatorio. La Tabla No. 4 muestra los valores de los elipsoides mas
utilizados.
Los elipsoides WGS (World Geodetic System) 72 y 84, fueron determinados por satélites y son
considerados los mas precisos, aunque no necesariamente serán la mejor opción para cualquier lugar
de la tierra.
El elipsoide se utiliza como referencia para la elaboración de mapas a escalas grandes. Las posiciones
horizontales se ajustan al elipsoide.
Tabla No. 4 Elipsoides más usados
Nombre
WGS84
WGS72
Krasovsky
Internacional
Clarke
Clarke
Bessel
Everest
2.2.1.3
Fecha
1984
1972
1940
1924
1880
1886
1841
1830
Ecuatorial
6378,137
6378,135
6378,245
6378,388
6378,249
6378,206
6377,397
6377,276
Polar
6356,752
6356,750
6356,863
6356,911
6356,514
6356,583
6356,079
6356,075
Achatamiento
1/298,257
1/298,26
1/298,3
1/297
1/293,46
1/294,98
1/299,15
1/300,8
El Geoide (Geo, tierra; como)
Consiste en una forma tridimensional que resulta de la proyección aproximada del nivel medio del mar
y su continuación hipotética sobre los continentes. Puede definirse como una superficie equipotencial
del nivel del mar, es decir, la superficie en la cual la gravedad es igual a la del nivel del mar.
Si la tierra no presentara montañas, ni depresiones y estuviera compuesta del mismo material
geológico, el elipsoide y el geoide serían iguales. Sin embargo, debido principalmente a las variaciones
en la densidad de las rocas y al relieve, las superficies del geoide y el elipsoide se desvían hasta en
100 m en algunos lugares.
Las montañas y valles del geoide no corresponden con los continentes y montañas. De hecho, el punto
mas alto del geoide se encuentra 75m sobre el elipsoide en Nueva Guinea y el mas bajo de 104m, está
hacia el sur de la India.
El geoide es la superficie de referencia utilizada para inspeccionar las posiciones verticales y
horizontales.
2.2.2
El uso de las coordenadas Geográf icas
El conjunto de latitudes y longitudes a lo largo del planeta, forma un sistema coordenado conocido
como sistema de coordenadas geográficas. Ver Figura No. 4
12
NOTAS CLASE SIG I
Figura No. 4 Sistema de coordenadas geográficas
2.2.2.1
Latitud.
Es el ángulo medido en el centro de la tierra, desde el ecuador hasta cualquier punto ubicado hacia el
norte o hacia el sur del mismo. Varía de 0 a 90°. El grupo de puntos con igual latitud forma las líneas
llamadas paralelos. Ver Figura No. 5
Figura No. 5 Medición de latitud
2.2.2.2
Longitud.
Es el ángulo medido en el centro de la tierra desde el meridiano de Greengwish hasta cualquier punto
localizado hacia el oriente o hacia el occidente del mismo. Las líneas que conforman los puntos de
igual longitud se denominan meridianos. La longitud se mide de 0 a 180° . El meridiano de
Greengwishg fue reconocido como origen en la conferencia internacional de meridianos en 1884. Ver
Figura No. 6.
13
NOTAS CLASE SIG I
Figura No. 6 Medición de longitud
2.2.3
Los tipos de proyecciones cartográf icas.
La correspondencia entre los puntos en la superficie de la tierra y un plano se hace por medio de
proyecciones, las cuales son una transformación matemática utilizada para “proyectar” la forma
esférica de la tierra a un plano o forma bidimensional (Figura No. 7).
Figura No. 7 Proyección cartográfica a un plano
Se han descrito mas de 400 tipos de proyecciones. Para el caso de Colombia, se utilizan la proyección
Conforme de Gauss en la cartografía del IGAC, y la proyección Universal transversa de Mercator para
el caso de la cartografía del DMA.
La red imaginaria de paralelos y meridianos hace una cuadrícula, la cual tiene ciertas características
que los cartógrafos tratan de preservar: Distancia, Dirección y área.
2.2.3.1
Distancia
14
NOTAS CLASE SIG I
La distancia mas corta entre dos puntos en la esfera es un arco. El círculo establecido por la
intersección de un plano que pasa por el centro de la tierra se denomina círculo máximo. El ecuador es
el único círculo máximo; los demás paralelos se denominan círculos pequeños. Es posible realizar
proyecciones de tal manera que los meridianos tengan el mismo tamaño y sean la mitad de la
distancia del ecuador.
2.2.3.2
Dirección
La dirección en una superficie esférica es arbitraria, pues no hay límites. Por convención N-S se toma a
lo largo de los meridianos, y W-E a lo largo de los paralelos. En la cuadrícula estas líneas son
perpendiculares, a excepción de los polos. Las direcciones dadas por la orientación de la cuadrícula
pueden ser geográficas o magnéticas. El polo magnético se encuentra a 1300 Km al sur del Norte
verdadero.
La dirección va cambiando a medida que nos trasladamos por un círculo máximo del globo.
únicamente a lo largo de un meridiano, o del ecuador, las direcciones permanecerán constantes. Como
la distancia mas cercana entre dos puntos es el círculo máximo, los cartógrafos hacen mapas que
mantienen las direcciones. Estas líneas se conocen como líneas de rumbo o loxodrómicas.
2.2.3.3
Area
El área de cada cuadrícula (1 meridiano, 1 paralelo), variará. Unicamente aquellos que se encuentran
entre los mismos paralelos y meridianos serán iguales. ej. 30°40’N y 30°40’S.
2.2.3.4
Factor de escala
Al reducir un globo a un globo mas pequeño, decimos que el factor de escala de la reducción es igual
a 1, puesto que las distancias se mantuvieron constantes: únicamente se redujeron de manera
proporcional. Sin embargo, cuando queremos pasar de una superficie curva a una superficie plana,
este factor de escala no será mantenido, debido a que siempre tendremos que sacrificar alguna de las
tres características anteriormente descritas: distancia, dirección o área. Al utilizar una proyección.
siempre se tendrá algún tipo de deformación. Las proyecciones cartográficas pueden ser clasificadas
según sus propiedades, aspecto y forma.
2.2.3.5
Clasificación de las proyecciones según sus propiedades
Las proyecciones se clasifican, según sus propiedades en: conformes, equivalentes y equidistantes.
ü
ü
ü
2.2.3.6
Las conformes son aquellas que mantienen los ángulos pero no las áreas.
Las equivalentes son aquellas que mantienen las áreas pero no los ángulos.
Las equidistantes son aquellas que mantienen las distancias únicamente en una dirección y no
deforman los ángulos.
Clasificación de proyecciones según su forma
15
NOTAS CLASE SIG I
Según su forma se dividen en cilíndricas, cónicas y azimutales. A su vez pueden ser tangentes o
secantes. Al ser tangentes, tendrán únicamente una línea en donde las distancias tendrán un factor de
escala = 1. Al ser secantes tendrán dos. A medida que se aleja de esta distancia, el factor de escala va
siendo mayor, lo cual indica que habrá mayor distorsión.
2.2.3.7
Clasificación según su aspecto
Según su aspecto pueden ser normales, transversas y oblicuas.
2.2.3.8
Proyección Conforme de Gauss Kruger.
La proyección conforme de Gauss, tiene como origen la proyección transversa de Mercator y tiene las
siguientes características:
ü
ü
ü
ü
ü
ü
ü
ü
Unidades de medida: metros.
Aspecto: Transversa
Forma cilíndrica.
Divide a Colombia en 5 orígenes.
Cada origen cubre 3 grados
Las coordenadas planas de cada origen son 1000000m, 1000000m.
Utiliza como elipsoide: Hayford o Internacional
Las coordenadas geográficas de cada origen se muestran a continuación.
En la Tabla No. 5 se presentan los orígenes de coordenadas en Colombia, según la proyección
conforme de Gauss.
En la Figura No. 8 se presentan los cinco orígenes (en azul) empleados para Colombia, en donde
puede observarse que el cilindro es tangente a la esfera a lo largo de cinco diferentes meridianos cada
vez. Para el área de cubrimiento (en rojo) de cada origen, se ha determinado tres grados, debido a
que allí la deformación es mínima. Más allá del área de cubrimiento, las deformaciones empiezan a ser
inaceptables.
Tabla No. 5 Coordenadas de los orígenes de la proyección Conforme de Gauss en Colombia
ORIGEN
Bogotá
Este
Este-Este
Oeste
San Andrés
COORDENADAS GEOGRÁFICAS
LATITUD
LONGITUD
74°04’51’’30 W
71°04’51’’30 W
4°35’56’’.57N
68°04’51’’30 W
77°04’51’’30 W
80°04’51’’30 W
COORDENADAS GAUSS
X
Y
1’000.000 m
1’000.000 m
16
NOTAS CLASE SIG I
Figura No. 8 Orígenes (en azul) de la proyección Conforme de Gauss para Colombia
Para cada uno de estos orígenes, tanto en sentido longitudinal (Y), como en sentido latitudinal (X), se
adoptaron los valores 1’000.000m, 1’000.000m, con el objeto de evitar valores negativos en la
localización de puntos.
A partir de estos orígenes, las coordenadas planas aumentan de valor hacia el este (300.000 en
300.000m ) y disminuyen hacia el Oeste para los Y. De la misma manera para las X, aumentan hacia el
norte y disminuyen hacia el sur (IGAC, 1979).
2.2.3.9
ü
ü
ü
ü
ü
ü
ü
ü
ü
Proyección Universal Transversa de Mercator.
Unidades de medida: metros.
Aspecto: Transversa
Forma cilíndrica.
Abarca desde 84°N, hasta 80° S.
Divide al mundo, en dirección E-W en 60 zonas de 6°, empezando en el meridiano 180E. Numera
estas zonas empezando por el número 1 y terminado en el 60.
Divide al mundo, en dirección N-S en 20 zonas de 8°, a excepción de la última norte que tiene
cubre 10°. Cada zona tiene una letra, omitiendo las letras i y o y empezando en el paralelo 180S
con la letra A. Ver Figura No. 9.
Cada origen tiene una coordenada de 500.000m, hacia el este y hacia el oeste.
En dirección N-S , el origen se encuentra en el ecuador y tiene un valor de 0
Utiliza como elipsoide el WGS84. Algunas veces el de Clarke.
17
NOTAS CLASE SIG I
Figura No. 9 Sistema de coordenadas Universal Transversa Mercator
3
MODELOS DE REPRESENTACIÓN Y ESTRUCTURA DE DATOS
La representación de la información geográfica se realiza estructurando los datos. Esta estructura de
los datos es la que a menudo provee las diferencias técnicas claves entre los programas SIG que
compiten en el mercado. Estas estructuras se basan en modelos de datos genéricos de entidades y sus
relaciones e implementan estos modelos de datos. Mucha de la substancia de un modelo de datos
proviene de un marco de medición, como se mencionó en el capítulo anterior.
3.1 Formas básicas de modelamiento de datos
En un SIG pueden modelarse los datos en tres formas básicas: como una colección de rasgos discretos
en formato vector, como un conjunto de celdas con datos de atributos para cada una de ellas o como
un conjunto de puntos triangulados que modelan una superficie. Ver Figura No. 10
3.1.1
Modelo vector
Los datos vector representan los rasgos como puntos, líneas y polígonos y se aplica mejor a objetos
con bordes y formas definidas. Los rasgos tienen una posición y forma precisa, unos atributos y
metadatos.
18
NOTAS CLASE SIG I
Figura No. 10 Formas básicas de representación en SIG: Representación vector,
representación TIN con perspectiva y representación raster
Los marcos de medición basados en el control de los atributos son implementados más directamente
usando el modelo vector. Con base en la geometría analítica, un modelo vector construye una
representación compleja a partir de los elementos primitivos: puntos, líneas y áreas. Esos elementos
primitivos tienen una dependencia entre sí: las áreas son descritas por líneas de límites y la
localización de una línea puede ser aproximada por una cadena de segmentos de líneas que conectan
una serie de puntos. En la base, los puntos son representados por coordenadas. Ver Figura No. 11.
Figura No. 11 Estructura topológica
3.1.1.1
Representación de objetos aislados
El marco de medición de objeto espacial visto en la unidad anterior, se traslada a una simple
representación vector con cada línea y polígono definidos por una cadena de coordenadas. Cualquier
cadena puede representar una línea, pero un polígono debe estar cerrado. Aquí cada objeto contiene
su propia lista de puntos (coordenadas), pero no hay relaciones almacenadas.
Para representar un anillo interno dentro de un polígono (polígono isla), la estructura de datos aislada
a menudo emplea una línea que se repite y la cual conecta el polígono más externo con el interno.
Esto adiciona una gran carga a la verificación de duplicados, la cual disminuye las ventajas de la
estructura de aislamiento simple.
El marco de las isolíneas, ya que usa líneas de contorno, también se traslada directamente a esta
representación vector simple. Cualquier estructura en anillos para relacionar cada curva cerrada al
siguiente contorno, hacia arriba ó hacia abajo, crea relaciones que disminuyen el aislamiento.
Hay un potencial considerable de inconsistencias si una representación de objeto aislado es aplicada a
una red conectada de polígonos. Ya que cada objeto es independiente, entonces cada borde sería
representado dos veces. Un hueco o traslapo podría fácilmente ocurrir, sin que haya un método fácil
de detectarlo. Esto da origen a lo que se denomina polígonos " Sliver" (Figura No. 12)
19
NOTAS CLASE SIG I
Figura No. 12 Polígonos adyacentes representados por líneas de límites aislados
3.1.1.2
Representación de objetos topológicos
El modelo de datos topológico es más comúnmente usado en programas que implementan un rango
completo de operaciones sobre las representaciones vector. El modelo topológico incorpora las
relaciones de red, junto con la medición de las coordenadas; así puede manejar los requerimientos de
los marcos de coberturas conectadas.
Este modelo se centra en los límites o fronteras y provee conexiones explícitas a los nodos en cada
extremo, así como a los polígonos en la izquierda y la derecha. Estas relaciones pueden ser
implementadas en estructuras de datos diferentes, particularmente relacionando los polígonos a sus
límites y los polígonos internos a los externos. Una estructura de datos común crea una lista de
longitud variable de las cadenas que encierran cada polígono, con notación para la dirección (signo
positivo ó negativo). En la Figura No. 13 puede observarse las relaciones entre los componentes de
una red conectada. El polígono Botswana tiene tres países, vecinos; cada vecino requiere un límite
para separar los dos países; cada límite comienza y termina en un nodo. El diagrama muestra un
polígono con una lista de arcos que conforman su borde externo, el signo se usa para las direcciones
en reversa (to-node hacia from-node). De cualquier forma como esté implementada, cualquier
estructura de datos provee acceso a las mismas relaciones mencionadas.
La característica importante de todas las representaciones vector es que ellas permiten la colocación
libre de los puntos y de las líneas de límite para representar categorías. Así, el modelo vector
implementa directamente la intención de los marcos de medición donde los atributos sirven de control.
El modelo vector puede ser aplicado a otros marcos de medición, como al TIN. Las estructuras de
datos vector son el método de elección para el mapa coroplético de atributos continuos.
20
NOTAS CLASE SIG I
Figura No. 13 Estructura topológica de datos
3.1.2
Modelo raster
Los datos raster representan datos continuos o de imágenes. Cada celda (pixel) en un raster es una
cantidad medida. La fuente más común para un conjunto de datos raster es una imagen de satélite o
fotografía aérea. Un conjunto de datos raster también puede ser una fotografía de un rasgo, así como
construcciones. Los conjuntos de datos raster sobresalen por almacenar y trabajar con datos
continuos, como elevación, tabla de agua, concentración de polución y nivel de ruido ambiental.
Mientras que el modelo vector es construido a partir de primitivas geométricas como una estructura
lógica, el modelo raster tiene vínculos cercanos a la disposición física del hardware de gráficos de
computador. Raster se deriva de una palabra usada en ingeniería mecánica para una herramienta que
avanza en un barrido hacia delante y hacia atrás.
El modelo raster divide la región en bloques rectangulares (celdas de grilla o pixels) que son
completados con el valor del atributo medido.
La aproximación raster está directamente relacionada a los marcos que controlan el espacio para
poder medir los atributos. Las celdas raster pueden ser colocadas dentro de un sistema de referencia
espacial, pero ellas deliberadamente limitan la resolución para que actúe como control.
Un aspecto a considerar aquí es el tamaño de las celdas. Las celdas más pequeñas permiten al raster
aproximarse a la flexibilidad del sistema vector tan cerca como sea requerido, pero surge a un alto
costo por el espacio de almacenamiento.
21
NOTAS CLASE SIG I
A los finales de los 70 surgió un debate acerca de las ventajas y desventajas del modelo raster vs.
vector de representación. En esa época el debate giró alrededor de la eficiencia en la implementación
de las estructuras de datos, más que en los modelos fundamentales. Las preferencias hechas, fueron
conducidas más por la tecnología, que por la aplicación. Cada vez el debate ha hecho exclusiva alguna
de las opciones, lo cual no es adecuado, pues cada representación sirve a un marco de medición y
cada marco de medición tiene su uso apropiado. Es mucho más importante entallar las
representaciones a los axiomas de las mediciones y ultimadamente al propósito de la organización o
institución que permitir a la tecnología conducir las decisiones. En la medida en que los computadores
han caído en precio, el software ha podido desarrollar una más cercana aproximación de los modelos
conceptuales.
3.1.3
Modelamiento con datos triangulados
Un TIN es una forma eficiente y útil de capturar la superficie de una parte del terreno. Los TIN
soportan también vistas en perspectiva. Un TIN puede cubrirse con una imagen o fotografía para un
despliegue foto realista del terreno. Los TIN son útiles para el modelamiento de cuencas, visibilidad,
línea de visión, pendiente, aspecto, crestas y ríos, entre otros.
Un TIN puede modelar puntos, líneas y polígonos. Una triangulación está hecha de muchos puntos
masivos ("mass points") cada uno de los cuales tiene su x,y, y z. Las líneas de quiebre ("breaklines")
representan corrientes, crestas y otras discontinuidades lineales del terreno. Las áreas de exclusión
("exclusión areas") representan polígonos con la misma elevación como lagos o bordes de proyectos.
Ver Figura No. 14
Figura No. 14 Elementos de un TIN
De un TIN pueden ser generados mapas de contornos, usando interpolación lineal o un algoritmo de
suavización.
3.2 Implementación de modelos de representación
Una base de datos implementa una representación vector de los datos, con un conjunto de datos de
rasgos y con clases de rasgos, la representación raster con conjuntos de datos raster y la
representación de datos triangulados con redes irregulares trianguladas (TINs).
3.2.1
Modelamiento de superficies
Un SIG puede modelar una superficie de tres maneras generales: como una superficie raster, como
líneas de contorno o como una red irregular triangulada.
22
NOTAS CLASE SIG I
3.2.1.1
Superficie raster
Algunos datos del terreno vienen en forma de un grid uniforme con valores de elevación. Un ejemplo
es el modelo digital de elevación (DEM), el cual representa unos puntos de elevación espaciados a
intervalos regulares. Cada celda para un DEM tiene un valor de elevación asociado.
De un conjunto de datos raster con elevaciones, la elevación de cualquier punto sobre una superficie
puede ser estimada y un conjunto de contornos ser derivados (Figura No. 15).
Figura No. 15 Contornos derivados de una superficie raster
Las características de los conjuntos de datos raster son:
•
•
•
•
•
•
El modelo conceptual es simple y el almacenamiento de datos es muy compacto
El modelo raster tiene algoritmos muy sólidamente establecidos para procesar datos a través de
funciones de análisis
Los datos de elevación en formato raster son relativamente abundantes y su obtención se hace
más barata.
La estructura grid es rígida y no está conforme con las variaciones del terreno.
Los datos originales no se mantienen cuando se interpolan a un grid.
Los rasgos lineales no pueden ser bien representados para algunas aplicaciones.
3.2.1.2
Líneas de contorno
Pueden ser usadas para representar superficies. Esta es una línea que une valores iguales de
elevación. Los contornos son las fuentes más accesibles de información del terreno para la mayoría de
usuarios de mapas.
Los contornos poco espaciados son una señal clara de que el terreno en ese sitio es escarpado. Un
ángulo agudo en un contorno es una señal de una línea de corriente o cresta. Uno puede tener una
idea de la disposición del terreno leyendo los contornos sobre un mapa. Sin embargo, los contornos
son pobres para los modelos de superficie en el computador. La colección de todos los puntos sobre
los contornos no crean una buena base de datos de las superficies, pues siempre queda incierto el
cambio de la superficie entre uno y otro contorno. Por otro lado, es difícil remover los artificios de los
datos que introduce la conversión de los contornos a raster o a TIN, lo cual se hace necesario para
crear superficies como el DEM. Esta conversión de los contornos es usualmente el último recurso que
debería usarse para construir un modelo de la superficie.
23
NOTAS CLASE SIG I
3.2.1.3
Redes irregulares trianguladas (TIN)
Este es un modelo eficiente y exacto para representar superficies continuas. Un conjunto de datos TIN
es construido así:
1. Se colectan una serie de puntos con coordenadas X, Y y Z a través de instrumentos fotogramétricos,
GPS u otros medios; se colectan las líneas de quiebre donde la forma de la superficie cambia
fuertemente y las áreas de exclusión como lagos.
2. A partir de los datos de punto el software SIG crea una red opcional de triángulos llamados
Triangulación Delaunay. En TIN cada triángulo es creado para ser lo más cercano posible a un
equilátero. Ver Figura No. 16
3. Cada triángulo forma una cara con un gradiente (inclinación) de pendiente
Figura No. 16 Face triangulada de un TIN en un espacio tri-dimensional
A partir de un TIN, una elevación puede ser calculada para cualquier punto con valores X y Y, primero
localizando el triángulo y después interpolando la altura dentro de él.
Un TIN es eficiente porque la densidad de puntos sobre cualquier parte de la superficie puede ser
proporcional a la variación en el terreno. Una superficie plana tiene con una densidad baja de puntos y
un terreno montañoso requiere una densidad alta de puntos, especialmente donde la superficie cambia
abruptamente. Además permite integrar las líneas de quiebre del terreno y los sitios de igual altura ó
áreas de exclusión.
Despliegue de superficies con un TIN:
Hay diversas formas de visualizar la superficie representada por un TIN. El TIN puede ser dibujado
sobre un mapa planimétrico (bi-dimensional) con colores representando elevación, pendiente y
aspecto.
Con despliegue tri-dimensional se pueden desplegar vistas con perspectiva de una superficie cubierta
por imágenes, curvas de contornos, líneas de grid u otros rasgos.
3.2.2
Modelamiento de imágenes o datos de muestras
Los datos de imágenes son coleccionados por sistemas de satélite o fotografías aéreas. Como esta es
una manera costosa de coleccionar grandes cantidades de datos geográficos, las imágenes son
componentes muy importantes de muchos SIG.
24
NOTAS CLASE SIG I
3.2.2.1
Conjuntos de datos raster
Los datos raster pueden ser usados como fondo para el despliegue de mapas, como una fuente para
extracción de rasgos para modelos de superficie en grid o para el modelamiento de funciones
geográficas de proximidad como dispersión. Un software SIG puede superponer rápidamente
conjuntos de datos raster.
Un conjunto de datos raster almacena una matriz bi-dimensional con valores de muestras para cada
celda. Cada celda tiene el mismo ancho y altura. Ver Figura No. 17
Figura No. 17 Conjunto de datos raster
La coordenada geográfica de la esquina superior izquierda del grid, junto con el tamaño de la celda y
el número de filas y columnas definen la extensión espacial del conjunto de datos raster. Los valores
de celdas para el conjunto de datos raster pueden ser enteros o puntos flotantes y representar varias
características. En fotografías, pueden representar la reflectancia de la luz; en una imagen de satélite
la intensidad de la luz en una determinada parte del espectro electromagnético; puede ser un atributo
derivado de una medición como tipo de uso del suelo o un tipo de rasgo como una construcción o una
calle; puede corresponder también a un valor Z como una elevación o concentración.
Una tabla de atributo de valores puede ser asociada, opcionalmente, con un conjunto de datos raster y
en algunos software, no en todos (Figura No. 17).
Un conjunto de datos raster puede tener una o varias bandas. Cada banda tiene una disposición grid
idéntica, pero representa un atributo diferente. Ver Figura No. 18
Figura No. 18 Bandas en un conjunto de datos raster
25
NOTAS CLASE SIG I
Conjunto de datos raster como atributos de rasgos:
No todos los conjuntos de datos raster tienen una referencia geográfica, también es posible utilizar
una imagen como un atributo de un rasgo geográfico.
Si se está construyendo un SIG para vender casas, por ejemplo, podría esperarse que cuando un
probable comprador ve un mapa con las ubicaciones de las casas, sea posible acceder a una imagen
de la casa elegida al hacer click sobre su ubicación.
Otros ejemplos de imágenes como atributos de características son:
•
•
Documentos escaneados
Planos o diagramas esquemáticos.
Representación de puntos, líneas y polígonos:
Un punto puede ser representado en un conjunto de datos raster a través de una celda o un grupo de
celdas contiguas. Las líneas pueden ser representadas por series de celdas que tengan un ancho de 1
o 2 celdas. Los polígonos pueden ser representados por un rango de celdas. Ver Figura No. 19.
Aunque es posible identificar visualmente puntos, líneas y polígonos en un conjunto de datos raster,
lo mejor es realizar una conversión raster-vector, si se quieren manejar este tipo de geometrías. Es por
ello que los software SIG traen incorporadas funciones de conversión de datos raster a vector.
Figura No. 19 Representación de geometrías de punto, línea y áreas en raster
Conversión de conjuntos de datos raster:
Los conjuntos de datos raster pueden ser generados con facilidad, pero a veces es más conveniente
tener los rasgos en otro tipo de representación. Un ejemplo es convertir una fotografía aérea de unos
edificios, en un conjunto de datos vector que contenga los edificios representados como polígonos
(Figura No. 20). La resolución del conjunto de datos raster influye en gran medida en la precisión del
conjunto de datos vector resultante.
Figura No. 20 Conversión de datos raster de una fotografía aérea en datos vector
(edificios)
26
NOTAS CLASE SIG I
3.2.3
Modelado de rasgos discretos
Los rasgos geográficos están localizados en la superficie de la tierra o cerca de ella. Pueden ser
naturales (ríos, vegetación), artificiales (vías, tuberías, edificios), y pueden ser subdivisiones de tierra
(provincias, lotes, divisiones políticas).
Los conjuntos de datos vector modelan el mundo con puntos, líneas y polígonos.
3.2.3.1
Conjuntos de datos de rasgos
En los conjuntos de datos vector, cada ubicación es registrada como una coordenada X,Y. Como se
había mencionado, los puntos se almacenan como un único par de coordenadas. Las líneas, como una
serie ordenada de pares de coordenadas y los polígonos como series de pares X,Y, que definen los
segmentos que encierran un área.
Rasgos punto:
Los puntos representan rasgos geográficos sin área ni longitud, o rasgos que son demasiado pequeños
para una escala de mapa determinada. Ver Figura No. 21
Figura No. 21 Rasgos de puntos
Rasgos Línea:
Representan objetos que tienen longitud pero no área, o rasgos cuya forma es demasiado angosta
para una escala determinada. Ver Figura No. 22
Figura No. 22 Rasgos de líneas
Rasgos polígono:
Se usan para representar áreas como estados, territorios de ventas, unidades geológicas, lotes, países,
etc. Los polígonos encierran áreas que cumplen con un conjunto común de características definidas
por el usuario para el fenómeno que está siendo representado. Ver Figura No. 23
27
NOTAS CLASE SIG I
Figura No. 23 Rasgos de polígonos
Cómo los mapas presentan información descriptiva?:
Los mapas muestran información descriptiva de los rasgos geográficos que representan usando
símbolos y etiquetas.
•
•
ü
ü
ü
Las carreteras se dibujan con varios anchos de línea, patrones y colores pare representar
diferentes tipos de vías u otros atributos.
Las corrientes y cuerpos de agua son típicamente dibujados en azul
Los símbolos especiales denotan rasgos específicos como ferrocarriles y aeropuertos.
Las calles de las ciudades se etiquetan con nombres y a veces con rangos de direcciones.
Los edificios especiales se etiquetan con sus nombres o funciones.
3.2.3.2
Asociaciones Rasgos, redes y topología
Los rasgos pueden tener tres roles básicos ó asociaciones con respecto al otro: simple, de red y
topológico.
Rasgos simples:
Los rasgos pueden ser simples, sin conexiones explícitas o asociaciones topológicas con otros rasgos.
Estos corresponden a los marcos de mediciones de objetos espaciales. Ver Figura No. 24
Figura No. 24 Asociaciones simples de rasgos
Rasgos de red:
Los rasgos pueden conectarse en una red. Esta asociación corresponde a los marcos de medición de
objetos conectados.
Una red está compuesta de arcos (edges) con nodos en sus puntos finales. Un nodo puede conectarse
a uno o más arcos. Este ensamblaje de arcos y nodos es llamado una “red geométrica”. Ver Figura No.
25
28
NOTAS CLASE SIG I
Figura No. 25 Asociación de red geométrica
Arcos compartidos en una topología:
Este tipo de asociación corresponde a los marcos de mediciones de objetos conectados (categorías
conectadas).
Los elementos topológicos de los rasgos pueden ser derivados y editados.
En un editor es posible especificar un conjunto de rasgos y crear una topología plana, la cual es un
conjunto de primitivas topológicas: nodos, arcos y ‘caras’ (faces). Ver Figura No. 26
Figura No. 26 Asociación topológica
Cuando se edita un nodo, los arcos a los que él está conectado, se estiran para ajustarse a la nueva
posición del nodo. Cuando se edita un arco, también se modifica la forma de dos caras a la vez (las
que están a la izquierda y derecha del arco).
3.2.3.3
Rasgos y Cartografía
Los rasgos son objetos geográficos en el contexto de un mapa. Un mapa tiene una escala, la cual
determina la dimensión de los rasgos: punto, línea o polígono.
ü
Los edificios pueden ser dibujados como polígonos si la escala es grande y como puntos a escalas
pequeñas (Figura No. 27) .
Figura No. 27 Dimensión de edificios a diferente escala
29
NOTAS CLASE SIG I
ü
Un área de bosque puede ser dibujada como árboles individuales a una escala grande y como un
polígono de bosque a una escala pequeña. Ver Figura No. 28
Figura No. 28 Discriminación bosque y árboles individuales a diversas escalas
ü
Un río en una escala muy grande tendrá muchos puntos de forma y pequeñas ramificaciones. A
pequeña escala, el detalle de las líneas es menor y las corrientes más pequeñas son removidas.
Figura No. 29 Detalle de una red de drenaje a escala grande y pequeña
ü
Si se requiere cambiar la dimensión de los rasgos a diferentes escalas de visualización, es posible
configurar una relación con otra clase de rasgos en la base de datos. En la Figura No. 30 puede
apreciarse los árboles asociados con diversos tipos de bosques. Al dibujar el mapa, la escala
determina qué conjunto de rasgos es dibujado.
Figura No. 30 Cambio en la dimensión de los rasgos a distintas escalas de visualización
SELECCIÓN DE REPRESENTACIONES
En una base de datos las tres representaciones vector, raster y TIN pueden usarse.
La selección de la representación a menudo es definida por los datos disponibles y las tareas de
análisis. Otras veces no es tan obvio cuál es mejor.
Los aspectos relevantes en la selección de una representación, se organizan en grupos, teniendo en
cuenta las siguientes consideraciones:
30
NOTAS CLASE SIG I
VECTOR
RASTER
TIN
Se usa vector si se
Se usa raster si se
Se usa TIN si se
1. El enfoque es hacia los rasgos
quiere
representar
trata
de
un
área
con
tienen puntos y
ó hacia su localización?
objetos distintos con
muestras uniformes
valores muestreados
atributos y un
de atributos en un
para una densidad
comportamiento
GRID.
específico
2. Qué datos hay
Se realiza un juicio sobre si los datos existentes son suficientes ó no,
disponibles?
para tomar decisiones como: Digitalizar, usar fotografías aéreas,
GPS, convertir datos de vector a raster, de raster a vector ó de
vector a TIN ó a GRID, contorno vector a puntos, etc.
3. Cuál es la exactitud
Se usa vector si la
La localización de
Solamente la
requerida para localizar
exactitud requerida es rasgos aquí tiene
localización de los
rasgos?
alta. Aquí la
restricciones en
puntos y las líneas
identificación y
dependencia del
de quiebre son
selección de rasgos es tamaño de la celda.
exactos.
más fácil. Los valores
precisos de
coordenadas son
almacenados.
4. Qué tipos de rasgos es
Para representar
Si se modelan rasgos Si se modelan
requerido representar?
algunos rasgos
grandes, con valores
rasgos que
naturales como
que varían, cambian
caracterizan la
sistema de drenaje o
con el tiempo o tienen forma de la
construcciones hechas límites indistintos.
superficie de la
por el hombre
tierra, como
(infraestructura vial,
montañas, picos,
oleoductos, u otras
parte aguas,
con arcos circulares)
drenajes.
5. Qué tipo de asociación
Algunos objetos son aislados, entonces no requieren relaciones con
topológica?
otros. Otros se almacenan para servir de fondo, entonces no
requieren topología. En otros casos es necesario manejar redes
conectadas, bien sea de rasgos lineales como drenaje (arcos y nodos
permiten la conexión) ó bien sea de categorías conectadas (cada
punto está cubierto por un polígono)
6. Qué tipo de análisis es
Para la localización
Dispersión de un
Funciones para
requerido?
óptima de elementos rasgo indeterminado
generar pendientes,
(por ejemplo
en el tiempo (pluma
aspectos,
negocios), servicios,
de contaminación),
construcción de
flujos a través de
análisis de
perfiles, cálculo de
conexiones (redes)
proximidad, de
volúmenes
distancias con costo y
coincidencia espacial
de varias
características.
7. Qué tipo de mapas
Rasgos más finos,
Rasgos que ocupan
Superficie s y sus
tienen que ser producidos? más pulidos
gran espacio, con
cambios, con
variación continua.
perspectivas 3D.
CONSIDERACIONES
31
NOTAS CLASE SIG I
4
CONVERSION DE DOCUMENTOS EXISTENTES (DIGITALIZACION)
El proceso de representación va más allá de las formalidades de diseñar un modelo de datos en
computador. Cada fuente de datos envuelve muchas decisiones prácticas para convertir estas fuentes
a estructuras apropiadas para el procesamiento posterior. Como un ejemplo de todas las posibilidades
está la digitalización usando el método manual o la tecnología de escaneo.
En los períodos tempranos del SIG, no había recursos de datos digitales existentes. Cualquier proyecto
tuvo que empezar con el proceso de construir una base de datos desde el principio. En algunos casos
una fuente digital como los sistemas de sensores remotos, pudieron proveer las fuentes de datos, pero
por otra parte, el único recurso fue la conversión de la información existente, típicamente en forma de
mapas en papel. Este proceso es llamado conversión, por que él convierte las representaciones físicas
dentro de datos digitales.
Incluso ahora, el proceso de construcción de bases de datos puede ser muy prolongado. La industria
de conversión actualmente consume una gran cantidad del presupuesto anual, para generar
información geográfica en todo el mundo. Cuando los materiales son ya digitalizados, esta cantidad del
presupuesto declina. Aún así, el proceso de digitalización provee una herramienta organizacional
excelente para confrontar los tópicos de representación.
Un SIG siempre está “hambriento” de datos. Las fuentes de información existente, la mayoría en
forma de mapas y tablas de atributos, son a menudo tomadas como servicios, sin reflexionar mucho
acerca de su contenido. La tecnología de construcción de mapas, simbolización y distribución, limita la
representación de fenómenos espaciales, imponiendo ciertos marcos de medición. Sin embargo, no
importa que tan limitado ellos son, estos recursos de información son a menudo los más buenos que
pueden encontrarse dentro de los presupuestos de tiempo y dinero. La digitalización ha consumido,
usualmente, la mayor tajada de los presupuestos de los proyectos, frecuentemente más de la mitad
del total de los fondos. Esos costos pueden ser controlados mejor, entendiendo la naturaleza de los
materiales de entrada y las relaciones que deben ser creadas en la base de datos.
La planeación general del proyecto a realizar, es fundamental para empezar con el proceso de
digitalización. Esto, debido a que es necesario tener claro que se quiere del SIG, y por tanto, de qué
manera se ingresarán los datos al proyecto. Una correcta planeación, evitará horas de edición.
Las primeras preguntas que deben hacerse en un proyecto de digitalización son:
1.
2.
3.
4.
Cuál será el propósito de los datos?
Se unirán con una base de datos mayor?
Con qué software de SIG, se utilizarán los datos?
Qué sistema coordenado se debe utilizar? Depende del objetivo del proyecto, puesto que cada
transformación de un sistema a otro, adicionará errores al mapa.
5. Cuál es la exactitud de las coberturas a ser combinadas posteriormente? (bordes comunes,
generalizaciones, etc.
6. Cuál es el objetivo final del mapa? Que tipo de exactitud requiere su representación final?
7. Qué paquete trabaja la institución para la cual se está desarrollando el proyecto? Es mejor
introducir datos directamente en el paquete en el cual se procesarán. Si es posible.
El proceso general de entrada de datos al SIG, se observa en la Figura No. 331.
32
NOTAS CLASE SIG I
DATOS DEL MUNDO REAL
INFORMACION ESPACIAL
INFORMACION NO ESPACIAL
ENTRADA DE DATOS
ENTRADA EN ARCHIVOS DE TEXTO
UTILIZANDO EL TECLADO
DIGITALIZADOR
SCANNER
VERIFICACION VISUAL
LIMPIEZA DE LINEAS Y UNIONES
ELIMINACION DE EXCESO DE
COORDENADAS
CORRECCION DE ESCALA Y DEFORMACION
CONSTRUCCION DE POLIGONOS
ADICION DE IDENTIFICADORES
ENLACE DE INFORMACION ESPACIAL Y NO
ESPACIAL
CORRECCION TOPOLOGICA Y CREACION
DE BASE DE DATOS
Figura No. 331 El proceso de la digitalización
33
NOTAS CLASE SIG I
Los datos en un SIG, pueden ser ingresados de diferentes formas:
ü
ü
ü
ü
ü
ü
Digitalizando con la ayuda de una tabla digitalizadora (calcado vector).
Escaneando mapas
Digitalizando en pantalla.
Por medio de colección de datos de GPS
Por medio de imágenes de satélite.
Por medio de archivos que ya se encuentren en formato digital (vector o raster).
4.1 Calcado Vector
El método más directo para digitalizar un mapa, es medir los movimientos de desandar los puntos y las
líneas. La visión temprana de la cartografía automatizada (entre 1958 y 1962) comenzó con una tabla
de dibujo automatizada donde la máquina grababa el movimiento de un puntero (Coppock y Rhind,
1991). El prototipo de lo que nosotros llamamos ahora una tableta digitalizadora movía, para todos los
lados, un gran imán debajo de la superficie de la tabla, direccionándolo de acuerdo con la señal
emitida por el puntero.
Las digitalizadoras modernas usan técnicas diferentes usualmente basadas en detectar la posición del
cursor en relación con una grilla de alambres fijados dentro de la superficie de la tableta. La exactitud
de la posición depende de la finura de la grilla de alambres y del hardware de detección de la señal.
Las mejores tablas digitalizadoras pueden tener una precisión de 0.075 mm., aunque ellas usualmente
registran en unidades enteras de 0.01 pulgadas (Jackson y WoodsFord, 1991). Las tabletas de más
bajo costo pueden incluso proporcionar exactitudes de 0.25 mm. ó de 0.5 mm., para áreas más
pequeñas. Estas precisiones, reflejan las capacidades de medición pura del dispositivo, no la exactitud
que pueda tener un operador, al digitalizar sobre la copia dura.
Los sistemas de digitalización pueden medir la localización del cursor, bien sea cuando son disparados
por un botón (modo punto) o sobre una base continua (modo “stream”). El modo continuo puede
registrar una localización después de un tiempo fijo o de un desplazamiento dado. Cada método tiene
sus desventajas. Los operarios de digitalización deben posicionar su cursor sobre los símbolos en el
mapa. La exactitud del resultado, depende de la amplitud del símbolo gráfico, el estrés impuesto sobre
el operario al tener que oprimir el cursor a lo largo de una tabla grande, en ángulos difíciles y muchos
otros factores. El modo punto claramente aplica a los objetos punto y aplica también a rasgos
rectilíneos tales como límites de propiedades. El modo continuo (“streem”), puede proporcionar un
resultado más aplicable a líneas sobre el mapa más complejas, aunque requiere de filtrado para
desechar el sobre muestreo. El modo “streem” puede forzar a un operador a moverse lentamente, ya
que el cursor debe permanecer en la línea en todo momento.
En la digitalización manual, el operario humano interactúa con el software para codificar los rasgos de
un mapa. La capacidad de reconocimiento de patrones por parte del ser humanos es particularmente
importante, cuando los mapas incluyen muchos símbolos diferente, o cuando es relevante únicamente
una porción de la información.
La digitalización manual es menos exacta que la de los “scanner” de alta calidad y en ella son posibles
más formas de error. Es muy difícil motivar a los operarios de digitalización a que funcionen bajo
condiciones tan exactas. Desarrollos recientes de hardware y de software han comenzado a manejar
esta dificultad con el sistema “heads up”5 de digitalización.
5
Es una estación de digitalización que proporciona una interfaz gráfica de usuario sobre la pantalla de
una estación de trabajo (por eso se llama a veces digitalización sobre pantalla). El operador usa un
34
NOTAS CLASE SIG I
Existen varios elementos que pueden ser digitalizados: Redes, polígonos, puntos, y curvas de nivel o
isolíneas en general.
Redes: es necesario empezar en uno de los puntos extremos de la red. Posteriormente, puede
digitalizarse como cualquier línea. Cuando una línea, llegue a la otra, la digitalización debe detenerse.
Nunca debe cruzarse una línea con otra. La intersección entre dos líneas está representada por un
nodo.
Polígonos / áreas: se digitalizan en modo continuo, y si es posible se utiliza la opción de “snap” para
cerrar las áreas. Recuerde que sólo debe digitalizarse una vez cada borde. La topología se encargará
de identificar los polígonos.
Contornos: inicialmente debe conocerse el intervalo de curvas que quieren digitalizarse. Las curvas
deben ser continuas y no pueden estar interrumpidas por el texto con el número de la altura.
4.2 “Scaners” raster
Desde los primeros días del SIG, ha habido una búsqueda de una forma de abolir el trabajo pesado y
las inexactitudes de la digitalización manual. En los años 60’s el CGIS (Sistema de Información
Geográfica del Canadá) diseñó su esquema, alrededor de un escáner que consistía en una lámpara,
una fotocelda, un tambor para rotar el mapa y un motor para mover el equipo que captaba los datos,
el resultado fue un barredor por líneas del mapa original. Tecnologías similares han sido desarrolladas
explícitamente para mapas, algunas introduciendo lasers de alta precisión sobre tambores rotantes
para trabajos de diferenciación de colores, otros intentando realizar el seguimiento de líneas
directamente. Sin embargo, el más grande adelanto viene del mercado de los consumidores. Las
demandas de máquinas copiadoras y facsímiles han requerido escáners raster baratos y exactos –
“push broom”. Una máquina de fax moderna tiene un arreglo de dispositivos de carga acoplados
(CCD), de foto detectores, frecuentemente con 5000 elementos.
Múltiples arreglos pueden ser dispuestos para cubrir las grandes amplitudes de mapas y otros dibujos.
Cada detector reporta un valor de escala de grises (o un valor de color). Acoplados con un mecanismo
para mover el papel (o los detectores), estos detectores se convierten en un “scanner”. La resolución
de los detectores CCD, cada vez es más fina; una resolución de 0.025 mm (1000 puntos por pulgada)
ó mejor, puede ahora ser comprada por menos de lo que hace 10 años costaba uno de 0.2 mm. La
exactitud de estos “scanner” puede ser aún mayor de 0.5 mm. De acuerdo a la teoría básica de
muestreo, un scanner debe muestrear a la mitad de al amplitud de una línea para asegurar su
detección. Una línea de 0,1 mm (0.004 pulgadas), requeriría una resolución de barrido de 0.05 mm.
Los mapas poco pulidos, pueden ser escaneados con muestreos más gruesos, tal como con scannes
vendidos para labores de publicación, aunque estos scanners no tienden a ser lo suficientemente
grandes para hojas de mapa completos.
Un escáner captura una imagen del simbolismo gráfico. Usando operaciones de vecinos cercanos, el
boceto de una línea puede ser aislada y convertida a una representación vector. Las uniones de línea,
sin embargo, aún son un problema para la detección automatizada. La extracción de líneas depende
de la resolución de pixeles del scanner, pero aún más, depende de la naturaleza del mapa original.
Hay varias técnicas diferentes que utilizan mapas escaneados para grabar datos espaciales. Un método
consiste en escanear un mapa y posteriormente utilizarlo como fondo desde el cual se pueda digitalizar
puntero (por ejemplo un mouse) para navegar sobre la imagen, escaneada de la fuente original, sin
tener que mirar hacia abajo como con la tableta digitalizadora.
35
NOTAS CLASE SIG I
sobre pantalla. Otro método consiste en utilizar software sofisticados para la conversión de datos
raster en datos útiles para el SIG.
En el momento de escanear un mapa, es necesario tener en cuenta lo siguiente:
ü Qué tipo de imagen se requiere según el objetivo específico (Blanco y negro o color) .
ü Qué resolución medida en puntos por pulgada (dpi).
ü Cual será el tamaño del archivo según la resolución seleccionada: A mayor resolución (Puntos
por pulgada), mayor cantidad de bits requerida y archivo mas grande.
ü La limitación de la resolución generalmente estará dada por la posible resolución del escáner.
ü Algunas veces la limitación puede ser el tamaño de archivos de imágenes de los hardware.
ü Si se escanea a color (verdadero, falso), se requiere un mayor número de bits y por tanto el
tamaño del archivo será mayor; a mayor selección de dpi, mayor resolución espacial y mayor
tamaño del archivo.
La combinación de un escáner con una estación de trabajo interactiva, le permite a un operario ver el
gráfico escaneado y aplicar los algoritmos de detección de líneas. Esta combinación es llamada
digitalización “heads up”. Alternativamente una fotografía escaneada, puede ser usada como fondo
para interpretar, replicando así el ambiente tradicional de compilación de mapas. La pantalla de la
estación de trabajo se convierte en un dispositivo de despliegue flexible para el material gráfico,
ofreciendo la habilidad de pan y zoom sobre una gráfica virtual grande. Un simple mouse puede
seleccionar los elementos de esta imagen en forma tan exacta como sobre una tabla grande de
digitalización. Estas técnicas de escaneo han hecho que las de digitalización manual se vuelvan
obsoletas.
4.2.1
Consideraciones de la resolución:
ü La resolución es la densidad de pixeles en una imagen raster en una distancia dada.
ü Debido a que las pulgadas son una unidad común de medida en los países en donde se
desarrolla software, punto por la pulgada (DPI) es la unidad utilizada frecuentemente.
ü Como una fila escaneada tiene como longitud un pixel, el proceso de alimentación de un
escáner es mas eficiente manejando mapas grandes.
ü El usuario debe saber manejar de una forma equilibrada la resolución y el almacenamiento de
la información.
ü Un aumento de 2X en la resolución producirá una imagen con un tamaño de almacenamiento
cuatro veces mayor.
ü Use la siguiente regla como base6 :
200 dpi para poder ver textos y artes.
300 dpi para ver la mayoría de las fotografías
400 dpi para ver ortofotos de alta calidad.
ü Con las consideraciones de arriba, un escáner de 600 dpi, puede responder a la mayoría de las
necesidades.
4.2.2
Escala y Exactitud
ü Recuerde que un mapa escanedo nunca podrá ser mas preciso que el mapa original.
6
Tomado de GIS Data Conversion
36
NOTAS CLASE SIG I
ü La exactitud se refiere a que tan correctos son los datos, mientras que la precisión se refiere a
la cantidad de detalle presente en los datos. Según esto, es posible tener un mapa escaneado
muy preciso pero inexacto.
ü Una manera para controlar la exactitud consiste en usar los mejores mapas posibles como
fuente. Recuerde que el papel se estira o se encoge a medida que cambia la humedad del
ambiente. Aunque se tenga un ambiente adecuadamente controlado, los puntos anteriores son
mas importantes que este último.
4.2.3
Preparación del Mapa
Los mapas requeridos para trabajar con SIG, deben estar geo - referenciados. Por esta razón es
necesario dibujar puntos de control en el mapa, si no están disponibles en el medio impreso. Es más
fácil hacer esto antes de escanear el mapa que después.
Aun, si se tiene un escáner de alta resolución, algunas características pueden no ser mostradas,
debido a que son símbolos complejos, sombreados, u otro tipo de patrones. Por esta razón, es
necesario en algunas ocasiones, iluminar o redibujar ciertas características en donde sea difícil la
diferenciación.
En general, se deben utilizar las siguientes reglas (GIS data conversión):
Nunca escanear un mapa sin puntos de control
Nunca escanear un mapa sucio
Si usted necesita pegar el mapa, utilice la mejor cinta posible.
Nunca utilice marcadores permanentes con base en petróleo (Estos pueden destruir su
escáner)
ü Nunca dibuje con lápiz (grafito)
ü Evite terminaciones poco definidas.
ü
ü
ü
ü
4.2.4
Otras consideraciones
ü Es preferible escanear en la resolución (dpi) que viene por defecto, a no ser que conozca
perfectamente la resolución espacial final y el tamaño deseado de la imagen.
ü Es preferible escanear en formato de colores 24-bits aún si la imagen está en blanco y negro,
esto le proveerá una más alta resolución espacial, si ésta se requiere.
ü Es preferible escanear utilizando el formato TIFF a no ser que se conozcan otras
especificaciones de software. Los archivos tipo TIFF pueden ser transformados fácilmente a
varios formatos.
4.3 Colección de datos de GPS
El GPS (sistema de posicionamiento global) permite calcular las coordenadas de cualquier punto, línea
o área geográfica, así como la creación y utilización de un diccionario de datos que facilita el ingreso
de información descriptiva sobre las características7 geográficas que se están midiendo.
El GPS, además de calcular las coordenadas de un nuevo punto, con un intervalo de tiempo de hasta
un segundo, permite calcular la velocidad, si el operador se encuentra en movimiento e incluso puede
localizar un punto de coordenadas conocidas, introducidas previamente dentro del receptor, a partir de
cualquier lugar con su opción de navegación.
7 Se habla de características “features”, cuando se trata de un objeto definido previamente con un nombre conocido en el diccionario de datos. Ejemplo casa,
lago, etc. Se habla de posiciones o puntos de coordenadas (positions) cuando no se han definido objetos específicos.
37
NOTAS CLASE SIG I
Una vez se hayan tomado las medidas en campo, es posible pasar los datos a un software. El
software permitirá corregir diferencialmente los datos para mejorar su precisión, desplegarlos
gráficamente y transferirlos a un SIG.
Dentro de los factores que pueden afectar la precisión de los datos, la cual puede tener un valor entre
1 y 100 m, se encuentran el número de satélites a la vista, la posición de los satélites en relación con
otros, la fuerza de la señal de los satélites y la distancia entre los GPS base y móvil. Los factores más
importantes son el equipo y los métodos de procesamiento de datos.
En una operación standard, el GeoExplorer II, por ejemplo, provee una precisión horizontal típica del
orden de 2 a 5 m. Para obtener este grado de precisión, el GeoExplorer debe estar configurado
correctamente y los datos deben ser corregidos diferencialmente. Los parámetros que deben ser
configurados se explicarán a continuación, al igual que la corrección diferencial.
El receptor GeoExplorer II, permite también recolectar datos con una precisión inferior a 1 metro
cuando se trabaja en el modo de alta precisión (High Accuracy) y se toman datos de una sola posición
por 10 minutos. Los datos obtenidos con esta opción, además, deben ser corregidos diferencialmente
con los datos de la base, también en el modo de Alta posición (carrier phase data). Los datos deben
además ser procesados utilizando la opción (Phase processor) del software.
4.3.1
La corrección Diferencial
La corrección diferencial, es un técnica que utiliza un receptor extra y algunos cálculos para mejorar la
precisión del GPS. Este proceso se basa en que los errores en la señal de un GPS serán comunes en un
radio de cerca de 500 Km. El GPS diferencial, puede ofrecer precisiones entre menos de 1 m y hasta
5m (Error Circular Probable8 - ECP).
La opción diferencial, requiere que un receptor conocido como estación base, esté localizado en un
sitio de coordenadas conocidas. La base, recibe los datos del GPS de los satélites que tiene a la vista,
mientras uno o más receptores (rover) reciben los datos de localizaciones desconocidas, utilizando el
mismo grupo de satélites para tal fin. Las posiciones grabadas por la base son comparadas con las
coordenadas conocidas y las diferencias son utilizadas para mejorar la precisión de las posiciones del
rover.
Las correcciones diferenciales pueden ser aplicadas mientras los datos son colectados en campo,
utilizando radios. Este procedimiento se denomina GPS Diferencial en tiempo Real. Las
correcciones diferenciales también pueden ser aplicadas en la oficina, una vez los archivos del rover y
de la estación se transfieran al computador. Este procedimiento se denomina corrección diferencial
postprocesada.
4.3.2
La corrección en Tiempo Real
Cuando se trabaja en el modo de corrección diferencial en tiempo real, la estación base calcula las
posiciones y los radios hacia los demás receptores y a partir del error de cada satélite envía un
mensaje a cada rover de tal forma que el error es corregido. El resultado es que la posición
desplegada en el receptor es corregida diferencialmente en tiempo real. Este método debe usarse si es
necesario conocer la posición precisa mientras se está trabajando en campo. Como las posiciones son
calculadas, pueden ser grabadas en un archivo o almacenadas como puntos de paso.
8 Error Circular Probable (ECP) significa 50% de los puntos colectados están dentro de un círculo de radio específico sobre un plano horizontal.
38
NOTAS CLASE SIG I
4.3.3
Corrección Diferencial Postprocesada
Para la corrección postprocesada, la estación base guarda datos de tiempo para cada satélite en un
archivo. El receptor rover, graba las posiciones en un archivo que posteriormente es transferido al
computador. Los dos archivos son procesados con algún software y el resultado es un archivo rover
corregido.
Una característica de todos los GPS Pathfinder Trimbel, incluyendo el receptor GeoExplorer II, es que
pueden grabar información no corregida y en tiempo real. Si la señal de los datos del GPS diferencial
se pierde o se vuelve intermitente, el receptor GeoExplorer, continúa grabando posiciones no
corregidas que pueden posteriormente ser corregidas en la oficina.
4.4 imágenes de satélite.
Otra forma de ingresar datos al computador, la cual se está constituyendo en una de las más
utilizadas, es por medio de imágenes de satélite, las cuales pueden ser procesadas y su información
utilizada para ser combinada con otro tipo de temas. Las imágenes de satélite trabajan en formato
raster, pero después de haber obtenido algunas categorías, producto por ejemplo de las clasificaciones
de coberturas, requeridas para un estudio específico, pueden ser vectorizadas, utilizando las opciones
que ofrecen los diferentes SIG. Otra forma de explotar las imágenes de satélite dentro del SIG, puede
ser por medio de digitalización por pantalla tal como se indicó anteriormente.
4.5 Archivos que ya se encuentren en formato digital (vector o raster).
Otra forma de ingresar datos al computador, es a partir de archivos digitales, los cuales pueden estar
en diferentes formatos. Cada software de los que compite en el mercado, tiene desarrolladas una serie
de rutinas que permiten exportar e importar archivos de datos para su transferencia. La ayuda en línea
en cada uno de ellos, le permite al usuario enterarse acerca de todas sus posibilidades. Actualmente,
transferir datos de un programa SIG a otro, ha dejado de ser una dificultad. Entre los software más
comerciales como ArcView, Arc/Info, IDRISI, Geomedia, Ilwis, GENAMAP, esto ya no es un problema,
pues cada uno tiene desarrolladas las rutinas para transferir de unos a otro programas. Los programas
que no transfieren los datos de un software específico emplean, por lo general, archivos tipo ASCII
para realizar la transferencia, entre los cuales los más comunes son los archivos de texto, como el
.DXF.
Los datos estructurados en forma raster también pueden transferirse de un software a otro, usando
archivos de tipo ASCII y binario.
5
TRANSFORMACION DE MEDICIONES POR DIGITALIZACION A COORDENADAS
Se efectúa a través de dos etapas: registro y proyección
5.1 Registro
Es el proceso de conectar una representación espacial a un sistema de referencia espacial,
para lo cual se usan los puntos de control (Tics para digitalización por mesa), con sus
coordenadas en unidades de digitalización y sus coordenadas reales. En el proceso, el
software ajusta todas las posiciones digitalizadas a sus localizaciones, dadas por un sistema
de coordenadas. Esas localizaciones son definas por coordenadas X y Y, calculadas a partir
39
NOTAS CLASE SIG I
de una transformación, la cual toma en cuenta suposiciones sobre el estado del mapa y la
forma como la digitalización fue realizada.
5.1.1
Transformaciones entre coordenadas de los puntos de control y
unidades de digitalización
Cuando la digitalización se realiza, siendo este un proceso muy falible, hay posibilidad que tanto los
errores humanos, como el estado en el que se encuentren los mapas fuente, haga que los puntos
digitalizados sufran deformaciones las cuales son “corregidas” a través de los parámetros que
contienen las ecuaciones resultantes de la transformación. Los aspectos que son “corregidos” en cada
caso, definen los diversos tipos de transformaciones.
5.1.1.1
Transformación similar
Cundo se considera que el mapa es rígido (el papel no sufrió deformaciones) y simplemente se rotan,
se trasladan y se escalan los puntos digitalizados. Una simple ecuación muestra esta transformación:
X = A+ Cx + Dy
Y = B - Dx + Cy
Donde:
C = Factor de escala por el coseno del ángulo de rotación
D = Factor de escala por el seno del ángulo de rotación
A y B = Desplazamiento para el centro de rotación en las coordenadas de salida
El procedimiento de transformación sigue los siguientes pasos:
1. Con base en las unidades de digitalización y las coordenadas reales de los puntos de control (Tics)
y empleando para el cálculo una regresión, coeficientes indeterminados, u otros, son calculados los
coeficientes A,B,C y D.
2. Para cada punto de control se resuelven las dos ecuaciones (en donde las incógnitas serían X y Y
y x y y, son las unidades de digitalización), lo cual permitirá evaluar que tan bueno fue el ajuste y
cual de los puntos aporta más al error medio cuadrático (RMS) total.
3. Se corrigen o suprimen aquellos puntos que están aportando más al error
4. Se transfieren todas las demás localizaciones de los puntos digitalizados a la nueva posición.
5.1.1.2
Transformación fina (“affine”)
Se usa cuando la escala no es la misma en los dos ejes (el escaner se pudo mover diferente en las dos
direcciones o el papel se contrajo o se expandió). La transformación “affine” provee dos escalas
diferentes en cada eje X y Y:
X = A + Cx + Dy
Y = B – Ex + Fy
C,D,E,F: Combina escalas diferenciales de X y Y y rotación
A y B: Desplazamiento para el centro de rotación en las coordenadas de salida
40
NOTAS CLASE SIG I
Los procedimientos son exactamente igual a los descritos arriba, con la diferencia de que el cálculo de
los coeficientes considera las escalas diferenciales de cada eje.
5.1.1.3
Transformaciones más complejas
Por ejemplo la transformación proyectiva de Arc/Info. Sirven para modelar distorsiones de lentes
fotográficos o un orden polinomial mayor. Aquí más puntos de control son requeridos
5.1.2
Errores en las transformaciones
Los errores ocurridos en las transformaciones son de dos tipos diferentes: pequeñas variaciones y
errores graves.
Las variaciones pequeñas son ineludibles en cualquier sistema de medición. Tomando mediciones
adicionales, este tipo de error de azar puede ser controlado fácilmente.
Para los errores graves (error en digitalización, cambio de valores para X y Y, etc.) se mira la
diferencia entre los valores ajustados y los valores reales, se eliminan los valores grandes y se reajusta
la transformación. Para nuestro caso el error usado es el medio cuadrático (ERM), el cual es la
discrepancia entre el valor verdadero de la coordenada de un punto y el de la coordenada actual
obtenida para ese mismo punto, usando las ecuaciones de la transformación. El error se calcula como
la discrepancia de valores para cada coordenada: X y Y.
5.2 Proyecciones
La práctica normal transforma las coordenadas del dispositivo de digitalización directamente a la
proyección seleccionada como sistema de referencia espacial. Este procedimiento puede no ser
adecuado en algunos casos, pues oscurece los pasos intermedios.
Algunas fuentes (mapas, fotos) ya tienen una proyección, si no es igual a la de destino, los sistemas
van a diferir. Localmente las diferencia puede consistir en una transformación similar rígida, pero a
escala grande las diferencias pueden ser muy sustanciales. Si la transformación de coordenadas de
digitalización a coordenadas de mapa es rígida y la transformación del mapa a la proyección es rígida,
entonces una transformación directa de la digitalización a la proyección también será rígida. En este
caso, no habría razones para pasar a través de pasos intermedios. Por otro lado, si se requiere alguna
corrección (por ejemplo ajustar la geometría del escáner, distorsión de lentes, encogimiento diferencial
o convergencia de proyección de fuentes existentes), entonces una única transformación no podrá
modelar la combinación de distorsiones geométricas.
Algunos países reducen la dificultad, organizando una proyección única como un sistema de referencia
espacial común, pero en países más grandes una sola no cubrirá todo el territorio, sin distorsiones (el
caso de Colombia).
Hay un número infinito de ecuaciones de proyección y de parámetros que controlan la geometría final.
La selección de proyecciones de mapas es a menudo una materia de tradición, vinculada a el
desarrollo histórico de un conjunto dado de usuarios de mapas. Los mapas de navegación son casi
universalmente dibujados en proyección Mercator, con el Ecuador como paralelo central y es conforme
(preserva los ángulos). Para mapas topográficos, la mayor parte del mundo es cubierta a algunas
escalas en Universal Transversa Mercator o en Lambert conforme Cónica. Los sistemas de referencia
estándar adoptan universalmente una proyección conforme, que acepte una cierta cantidad de error
de escala, para preservar los ángulos locales. Las proyecciones iguales de las áreas son más útiles
para muchos tipos de análisis con SIG.
41
NOTAS CLASE SIG I
Con los mapas computarizados las ecuaciones de proyección no son tan difíciles. Un mapa en una
proyección puede ser convertido a latitud-longitud (a través del inverso de la función de proyección) y
después proyectado a otra forma.
5.3 Referencia a servicios Geodésicos
La digitalización puede conectar las coordenadas locales del equipo de digitalización a sistemas de
referencia espacial permanentes. Eventualmente todas las proyecciones están relacionadas a
posiciones sobre la superficie de la tierra. Por razones históricas la forma más común de referencia a
las coordenadas geográficas es la latitud-longitud. Esos dos ángulos suponen un radio para una esfera
o un elipsoide dado, para especificar una localización en un cuerpo tridimensional. Actualmente hay
muchos elipsoides en uso , sin embargo las mediciones más precisas se realizan hacia los estándares
internacionales para la forma de la tierra, que fueron presentados en la Tabla No..
Los mejores puntos para ser usados en el registro son los de referencia geodésica usados para
construir los mapas originales o puntos cuyas coordenadas se conozcan de levantamientos especiales.
La práctica común en digitalización da mucha fe a las esquinas de las planchas y a otros simbolismos
que no están precisamente relacionados con la construcción en sí del mapa usado.
En el pasado los levantamiento geodésicos fueron muy costosos y el proceso de ajuste fue muy
complejo. Las observaciones formaban un red compleja de triángulos para conectar las áreas de
interés y reducir los errores. Los GPS han revolucionado muchos aspectos de las mediciones
espaciales. Usando este sistema de satélites de comunicación un receptor puede observar cuatro ó
más satélites que transmiten, calcular la distancia a cada uno y almacenar el resultado como
coordenadas proyectadas a un sistema. Con un segundo receptor ubicado en un punto conocido, un
levantamiento de GPS diferencial puede proveer resultados geodésicos de calidad, sin todos los
requerimientos intermedios de las tecnologías convencionales.
Los sistemas de mapeo han sido estructurados alrededor de suposiciones como que el control
geodésico permanecerá costoso. Sin embargo, las herramientas para integrar datos espaciales serán
cada vez más importantes, si el GPS guía a las fuentes de información referenciada a que tengan
coordenadas medidas en campo. Esta fuente de mediciones disminuiría la necesidad de digitalizar
mapas existentes.
Antes de evaluar la calidad de las coordenadas, se requiere recordar que la información geográfica es
a menudo una abstracción. Es poco importante registrar la localización de un símbolo de pantano más
allá de centímetros, sabiendo que él representa una región sin bordes claramente definidos. El
contenido de la información de una medición no requiere una exactitud alta para todas las
coordenadas.
6
CALIDAD DE LOS DATOS
Una vez un conjunto de medidas ha sido organizado dentro de un sistema de representación, resulta
prudente considerar que tan bien las mediciones realizan su trabajo. La primera palabra que se viene a
la mente es exactitud. Los mapas como mediciones son generados para ser exactos; mientras la
exactitud evoca los elementos espaciales del mapa, hay un número de tópicos relacionados, que
quedan mejor organizados bajo el título de calidad de datos. Todas las medidas pueden ser verificadas
de alguna manera comparándolas con el mundo ó entre ellas. Sin embargo, la mayoría de información
geográfica, involucra una simplificación útil del fenómeno, para ajustarlo dentro del marco de
medición; por eso, la verificación no es un proceso simple de revisar cada cosa contra un objetivo
42
NOTAS CLASE SIG I
estándar. De esta forma, el proceso de medición completo, debería ser verificado para asegurar que la
información se ajusta a su propósito.
En la
como
como
datos
estructura conceptual que estamos manejando, los tópicos de calidad de datos no se ajustan
un anillo dentro de las mediciones, representaciones y operaciones y transformaciones, sino
una reflexión sobre los resultados de representar una medida dada. Los tópicos de calidad de
son centrales para evaluar los resultados de digitalización y de cualquier otra representación.
6.1 Verificación y control de calidad
El estado de la medición en la digitalización, está lejos de ser el fin del proceso. La verificación y
control de calidad ocupan una mayor porción del esfuerzo en la construcción de un SIG. El resultado
burdo de un procedimiento de digitalización ya sea manual ó automático, crea un conjunto de objetos
geométricos. El término técnico para esta masa de geometría es “spaghetti cartográfico”, debido a que
está, no más estructurada, que un spaghetti sobre un plato (Christman, 1974). Un archivo spaghetti
puede ser usado para dibujar objetos geométricos de fondo, aunque pueda tener pequeñas fallas
geométricas introducidas por el sistema de digitalización. Las fallas pueden ser removidas por
inspección visual y manipulación gráfica, frecuentemente la aproximación usada con sistemas de
diseño asistido por computador (CAD).
6.1.1
Edición de errores
El modelo topológico fue desarrollado para reducir el esfuerzo en la verificación de los resultados de la
digitalización. Introduciendo un conjunto más complejo de axiomas, las relaciones entre objetos
pueden ser creadas con menos dificultad. Específicamente, el modelo topológico prohíbe el cruce de
las líneas con otras. Todos los cruces deben ser declarados como nodos, convirtiendo una maraña de
líneas a un grafo planar simple (ver Figura No.
26). Esta verificación puede ser hecha
automáticamente por el mismo software que realiza la superposición de polígonos o en un ambiente
interactivo (lo hace el usuario). Una vez un grafo ha sido construido puede ser verificado de acuerdo
con requerimientos adicionales. Para coberturas categóricas como parcelas o suelos, el propósito de
las líneas es separar polígonos; por lo tanto, cualquier arco que termine en un nodo final muerto, es
un signo de algún tipo de error. Este error se da bien sea porque un arco esté ausente o por que sobre
(“undershoot” o “overshoot”). Ver Figura No. 332. En lugar de tener que inspeccionar el mapa
completo, el operario puede dirigir su atención a corregir estos errores directamente.
En la figura puede observarse que el error se produce por una línea faltante que es la primera opción,
por una línea que no alcanza a llegar al nodo o por una línea que sigue adelante después del nodo.
La siguiente fase en cualquier digitalización involucra los atributos. Cuando se almacena información
geográfica en un SIG, cada característica geográfica tendrá dos tipos de datos almacenados:
ü Información acerca de su localización en forma de coordenadas geográficas explícitas.
ü Información descriptiva en forma de valores de atributos estandarizados.
Cada capa puede tener por ejemplo, los atributos de número de habitaciones, número de pesos, tipo
de material, número de personas que viven en ellas, etc.
En los SIG modernos, la información de localización y la de atributos, es almacenada en archivos
diferentes. Este proceso es totalmente invisible al usuario.
El proceso de asignación de identificadores, es el que consume más tiempo en la generación de bases
de datos. El tiempo invertido en el diseño al principio del proyecto ahorrará tiempo al final del mismo.
En el proceso de asignación de identificadores, es necesario conocer el concepto de Diccionario de
43
NOTAS CLASE SIG I
Datos el cual es un documento que define los atributos validos para un proyecto de digitalización,
especificando el tipo de dato, los posibles valores, la definición de cada uno de ellos y su validez. Los
códigos asignados como identificadores, deben, en los posible, cumplir con los estándares establecidos
por el gobierno y por cada una de las instituciones que maneja determinado tipo de datos.
Figura No. 332 Ejemplos de errores de digitalización señalados por un nodo final muerto
En algunos casos, los valores de atributos son asignados a los rasgos, a medida que las mediciones
geométricas son tomadas. Esto puede ser eficiente para rasgos de puntos y algunas clases de líneas.
44
NOTAS CLASE SIG I
Si cada polígono es identificado por la digitalización de un solo punto dentro del polígono, la creación
de la estructura topológica, adquiere la forma de chequear etiquetas. Todos los polígonos deberían
tener uno y solo un punto “label” (etiqueta). Si el procesador topológico encuentra dos puntos dentro
de una región, puede ser que los puntos o las líneas tienen error, tal como se muestra en la Figura No.
333. Típicamente, falta un arco, lo cual hace que se conecten dos polígonos que deberían estar
separados, quedando como un solo polígono con dos label. Un polígono sin punto, puede señalar la
omisión de un punto o señalar que alguna línea inadvertidamente dividió un polígono. Estos aspectos
ayudan a que el operario sea dirigido para solucionar los problemas.
Figura No. 333 Errores de digitalización detectados durante el etiquetamiento
Una vez los datos pasan la prueba, se les puede certificar su “limpieza topológica”, significando que el
software puede depender de la estructura de los datos. Las pruebas topológicas de la consistencia
45
NOTAS CLASE SIG I
lógica están particularmente bien desarrolladas en la generación actual de paquetes SIG. En forma
similar a otras pruebas lógicas, las pruebas topológicas usan la base de datos que está almacenada en
el sistema, sin fuentes externas de información. Un programa serio de control de calidad debe usar las
pruebas topológicas como un principio necesario, pero ellas no son suficientes para realizar el control
de calidad.
6.1.2
Otras pruebas de calidad de datos
Junto con las pruebas topológicas, debería haber consideraciones para los otros componentes de
calidad de datos. Por ejemplo, algunas formas de evidencia interna pueden ser usadas para validar el
rango de valores asignado a un atributo. Una prueba tal, realmente no verifica el valor específico para
un objeto particular, sino que localiza equivocaciones potenciales en todos los componentes. Pruebas
más detalladas de exactitud posicional, completitud y exactitud de atributos requieren alguna fuente
de información externa. Una fuente de datos puede ser la base de datos de exactitud más alta que
existe para una parte de la región, un programa de trabajo de campo u otras estrategias.
Los procedimientos para probar información geográfica son un área de sustancial interés de
investigación. Puntos de muestras son usualmente empleados para corroborar la exactitud de los
resultados de los procedimientos de clasificación de sensores remotos. El proceso de superposición
puede ser empleado para probar una cobertura contra otra. En ambos casos, las diferencias deben
considerarse con respecto a la resolución espacial deseada para los dos productos. Cualquier programa
de prueba es costoso y debe ser diseñado cuidadosamente.
La digitalización, a primera vista, está limitada por el material fuente. Los resultados nunca se verán
mejor que la calidad de los mapas originales. Ciertamente la dificultad de digitalizar es incrementada
por errores e inconsistencias en los mapas. Sin embargo, el proceso de conversión es más que la
versión digital de una máquina de copia. La calidad de los mapas puede ser mejorada imponiendo un
conjunto estricto de restricciones de integridad y relaciones. La representación digital fuerza a que
ciertas relaciones sean más obvias y requieran mayor consistencia. La era de la computación ha
popularizado el dicho “Basura entra, basura sale”. Mientras el computador permanezca como un
repositorio pasivo, esto será verdad. Si el procesamiento impone un conjunto estricto de restricciones
de integridad, el proceso de digitalización puede actualizar la representación del mapa de entrada, de
tal forma que sea algo mejorada.
7
DESPUES DE LA DIGITALIZACION
Después de la digitalización del material fuente, el resultado podría no corresponder exactamente a los
requerimientos. Otros procesos se necesitarán entonces para completar la construcción de la base de
datos. Por ejemplo, una tarea comprende la construcción de las coberturas mayores, a partir de las
planchas digitalizadas en forma separada. Otras usan cambios de escala, geocodificación y
transformaciones temporales, que se relacionan directamente con el proceso de digitalización.
7.1
Generalización y cambio de escala.
A pesar de las protestas de los cartógrafos, las fuentes de datos son descritas todavía en
términos tradicionales por una fracción representativa ósea por la escala cartográfica. Por
ejemplo se pueden encontrar en el mundo productos descritos como 1:24.000, 1:100.000 ó
1:2.000.000. cuando ellos son producidos por digitalización de los productos gráficos, esto en
cierta forma tiene sentido, pero hay que considerar las reglas usadas por la agencia en
particular, que los produce. Por ejemplo la serie de los 1:100.000, puede ser producida por
46
NOTAS CLASE SIG I
foto reducción de la serie 1:24.000 y la documentación de esta historia no siempre se lleva a
cabo. Los DEM (modelos digitales de elevación) producidos por el servicio geológico de los
Estados Unidos, son descritos a escalas 1:24.000, pero pocos de ellos son producidos a partir
de los contornos del producto gráfico, pues la mayoría son producidos independientemente por
muestreos de 30 metros sobre fotografías aéreas. La densidad de muestreo proveería una más
clara descripción de esos productos (más que la misma escala). La escala incluso llega a ser un
indicativo irrelevante para nuevas fuentes de datos, las cuales pueden ser creadas directamente
por compilación fotogramétrica sin usar ningún producto gráfico tradicional.
La escala ha sido como una serie de taquigrafía para un gran número de decisiones. Cuando
son restringidas al medio gráfico, las escalas mas detalladas típicamente implican mayor
exactitud; sin embargo esta relación no es obligatoria, pues la calidad de ciertos mapas no
corresponde con la escala. Estos mapas detallados podrán estar desactualizados por ejemplo en
30 años y si su uso es para generar las propiedades de los estratos socioeconómicos, es grave
que esas fuentes sean ambiguas, siendo distorsionada la información. La información de
escalas detalladas debe ser mas actualizada y más exacta en algunos aspectos.
En conclusión las reglas cartográficas asumidas por la escala incluyen muchos tópicos de
medición de los atributos e integridad, a lo largo con las relaciones geométricas.
Muchas técnicas cartográficas pueden ser aplicadas para reducir la cantidad de datos. Esto es
lo que se denomina generalización. Hoy en día existen muchas técnicas de generalización
automática de mapas. Una de esas herramientas mas frecuentemente usada es el algoritmo de
reducción de líneas de Douglas y Peucker, 1973. Este algoritmo trabaja línea a línea,
asumiendo que los puntos de los extremos son requeridos. En cada paso, una línea de
tendencia es construida entre los dos últimos puntos definidos como los requeridos. Los demás
puntos entre estos dos, son examinados para establecer la máxima desviación a partir de la
tendencia. Si esta desviación excede alguna tolerancia, el punto de mayor desviación es
seleccionado y dos líneas más de tendencia son creadas. Ver figura No. 34.
Este algoritmo de reducción del numero de puntos a lo largo de una línea no es el más rápido,
ya que debe encontrar la máxima desviación desde cada línea de tendencia. Existen filtros más
simples que pueden “limpiar” puntos cercanos con menos cómputos. Sin embargo esa
limpieza puede traer diversos errores topológicos, debido a la deformación de las geometrías a
unas nuevas. Ver Figura No. 35
Cualquier técnica de reducción de líneas fallará, si se extiende mas allá del propósito
perseguido. El algoritmo de Douglas y Peucker trabaja línea a línea y por eso no altera la
topología fundamental; sin embargo, algunas situaciones pueden requerir remover objetos
completos para realizar cambios radicales en las escalas. La reducción de líneas no da como
resultado la remoción de objetos completos o la fusión de ellos con sus vecinos.
7.1.1
Vinculando Atributos por geocodif icación.
47
NOTAS CLASE SIG I
Otro método para generar nuevas representaciones es el de vincular atributos a los objetos
existentes a través de mediciones indirectas. Por ejemplo, un hospital tiene registros de los
pacientes con una enfermedad particular, para examinar las causas ambientales de esta
enfermedad, la ubicación de la casa de cada paciente, es necesario localizarla sobre un mapa
digital. Esta localización puede ser asignada indirectamente, usando un procesamiento de los
datos tabulares existentes en el hospital. Estos datos deben ser agregados por ciudad o por
código postal aplicando un marco de medición de coropletas.
Figura No. 34 Generalización de líneas. Algoritmos Douglas y Peucker, 1973
48
NOTAS CLASE SIG I
A un nivel mas detallado, la dirección de la calle provee un sistema de referencia espacial.
Hacer casar las direcciones, consistiría en convertir la dirección de cada paciente a
coordenadas. El método para hacerlas casar varía dependiendo de las reglas que aplican las
direcciones en varios países e incluso regiones. Por ejemplo la numeración de las casas puede
ser con números pares e impares, para los lados opuestos de la calle. En algunos sitios se
registra el nombre de las calles y el rango de direcciones a cada lado. Así un numero de casa
podría ser interpolado en este rango.
Figura No. 35 Generalización de líneas por remoción de puntos
49
NOTAS CLASE SIG I
Mas allá de los detalles del sistema de direcciones especifico, el hacer casar las direcciones
representa un conjunto general de transformaciones orientadas a redes. La segmentación
dinámica vincula información de vías rápidas a una posición medida a lo largo de la ruta y de
igual forma información hidrológica, puede ser vinculada a un sistema de referencia de un río.
Cada uno de estos procedimientos lo que hace es vincular nuevos atributos a objetos que ya
existen en la base de datos. Estas técnicas pueden ser usadas en lugar de digitalizar.
7.1.2
Actualizaciones temporales y cambios
Quizá el componente mas débil en el manejo de datos geográficos es el tiempo. Si una fuente
de información existente falla en satisfacer los requerimientos debido a que está
desactualizada, entonces un proceso de actualización puede ser mas efectivo que una
reconstrucción total. Algunas actualizaciones pueden efectuarse usando fotografías aéreas u
otras imágenes, a través de la interpretación visual de las diferencias. Existen muchas técnicas
para la detección de cambios. Si el cambio es definido como una diferencia en dos instantes,
entonces es difícil separarlo del error en las fuentes. Un enfoque más directo busca las fuentes
de información que registran los cambios directamente. Por ejemplo un análisis de expansión
urbana puede usar los permisos de construcción como las imágenes para localizar nuevas
construcciones residenciales.
Las técnicas del SIG ofrecen muchas posibilidades para mejorar el tratamiento del tiempo y
del cambio. El método de representación ya no esta atado a la distribución masiva de
productos impresos estandarizados. Una base de datos computarizada debe ser diseñada para
mantener el registro histórico, como la evolución de la información. Las aplicaciones
científicas requieren información temporal para estudios de procesos y procedimientos legales.
Todavía el estado actual de la tecnología presenta un gran riesgo debido a los marcos
limitados para la representación, el tiempo no se puede manejar fácilmente. La historia de los
cambios que se realizan a la base de datos desaparece cuando se da el comando borrar,
dejando menos rastros que en la era de los mapas de papel.
7.2 Otros tópicos importantes de la calidad de los datos
El creciente interés por la calidad de fuentes de datos de un SIG es común entre los
especialistas de ahora. La calidad y disponibilidad de productos SIG debe ser evaluada
cuidadosamente, debido a la manipulación de datos espaciales por parte de las instituciones
privadas, la aplicación acelerada de los software SIG y el actual papel que desempeñan en la
toma de decisiones.
Actualmente existe un gran interés en cuanto al error inherente a las metodologías de SIG.
Aunque se esta llevando a cabo mucha investigación al respecto, el mercado de datos SIG
continua, razón por la cual es necesario realizar algunas consideraciones practicas para de esta
forma identificar los posibles errores y definir la calidad de los datos involucrados en un SIG.
50
NOTAS CLASE SIG I
7.2.1
Elementos de la calidad de datos
Los conceptos de exactitud, precisión y error son importantes para poder determinar esta
calidad.
La exactitud evalúa la cercanía de los resultados de observaciones con respecto a los valores
que se conocen como verdaderos. Esto implica que las observaciones de la mayoría de los
fenómenos espaciales sean considerados para estimar el valor verdadero. La diferencia entre
los datos observados y los verdaderos indica la exactitud de las observaciones.
Existen dos tipos de exactitud: La exactitud posicional y la exactitud de atributos. La
exactitud posicional es la desviación esperada en la ubicación geográfica de un objeto, con
respecto a su posición en el terreno. Hay dos componentes en la exactitud posicional: La
relativa y la absoluta. La exactitud absoluta concierne con la exactitud de elementos de
datos con respecto a un sistema coordenado especifico; p.e. Proyección transversa de Gauss.
La exactitud relativa concierne a la posición de dos coberturas, una con respecto a la otra. La
exactitud relativa frecuentemente es de mayor interés que la exactitud absoluta. Por ejemplo,
la mayoría de usuarios de SIG no pueden vivir con el hecho que las coordenadas de un
municipio no coinciden exactamente con las coordenadas de los sitios de una encuesta.
La exactitud de los atributos es igualmente importante pues también refleja la estimación de
la verdad, pero sobre las características de los elementos representados espacialmente. Por
ejemplo al interpretar y retratar los linderos y las características de un bosque, las posiciones
pueden haber sido definidas de forma complicada y subjetiva. Además el grado de
homogeneidad que se pudo haber encontrado en una unidad, probablemente no se aproxima lo
suficiente a la realidad como podría desearse por parte de varios especialistas.
La calidad puede simplemente ser definida como la aptitud de uso de unos datos específicos.
Los datos apropiados para una aplicación, pueden no ser útiles para otra. Esto dependerá de la
escala, la exactitud y el tipo de datos.
Los datos de transferencia espacial de USA (SDTS), identifican cinco componentes de calidad
de datos: El linaje, la exactitud posicional, la exactitud de atributos, la consistencia lógica y la
integridad.
El linaje, se refiere a la historia de los datos, es decir a los aspectos de compilación, tales
como la fuente, el contenido, las especificaciones de captura, la cobertura geográfica, el
método de compilación, los métodos de transformación que se aplicaron a los datos y el uso de
unos algoritmos pertinentes durante la compilación, por ejemplo. lineal, la simplificación,
generalización, entre otros.
La exactitud posicional es importante e incluye la consideración del error inherente (error de
fuente) y el error operacional (introducción del error).
51
NOTAS CLASE SIG I
La exactitud de atributos también ayuda a definir la calidad de los datos. Esta calidad se
refiere a la identificación de la confiabilidad, o al nivel de pureza (homogeneidad) en los datos
que se utilizaron.
La consistencia de la lógica determina la fidelidad de los datos, la estructura de los datos que
se utilizaron de tal forma que no se tengan inconsecuencias espaciales, tales como
intersecciones de líneas incorrectas, duplicación de líneas o linderos, entre otros. Estas ultimas
constituyen errores topológicos o errores espaciales.
La integridad muestra que tan complejos son los datos. Esto incluye consideración de
“huecos de los datos”: áreas no clasificadas, zonas con nubes y cualquier procedimiento de
compilación que pueda haber ocasionado eliminación de datos.
La facilidad de que los datos geográficos en un SIG puedan usarse a cualquier escala, destaca
la importancia de la calidad de información de los datos. Aunque en los SIG la escala puede
ser manipulada, la base de datos se producen con unos niveles de exactitud y una resolución
asignada a ciertas escalas.
7.2.2
Fuentes de error de la información Geográf ica.
Existen dos fuentes de error: Uno inherente y otro operacional, los cuales contribuyen a la
reducción en la calidad de los productos que son generados por los sistemas de información
geográfica. El error inherente es el error que se presenta en datos y documentos fuente. El
error operacional es la cantidad de error producido mediante la captura de datos y la
manipulación de las funciones del SIG. Las fuentes de errores operacionales incluyen: Mala
colocación de los labels sobre mapas temáticos; mala colocación de los linderos y bordes;
error humano al digitalizar; errores de clasificación; inexactitudes algoritmicas en SIG y
predisposición humana.
Aunque el error existirá siempre en cualquier proceso científico, en un SIG se debe estar
atento a identificar el error existente en las fuentes de datos y a minimizar la cantidad de error
agregado durante su procesamiento. Debido a las limitaciones de costo lo que se hace
frecuentemente es tratar de administrar el error antes que eliminarlo. Es casi igualmente
costoso reducir el nivel de error en una base de datos que crear y mantener la base de datos.
La conciencia de la condición de error en los diferentes conjuntos de datos, permitirá que el
usuario haga una declaración subjetiva sobre la calidad y confiabilidad de un producto
derivado de un SIG.
La validez de cualquier decisión con base en un producto de SIG, dependerá de la calidad y la
confiabilidad del producto. El depender del nivel de error inherente en los datos fuente y el
error operacional ocasionado mediante la captura y manipulación de datos, hace que los
productos SIG puedan tener cantidades significativas de error.
Uno de los problemas importantes que actualmente existe dentro de los SIG es el de la
circulación de datos geográficos digitales. Frecuentemente se cree que como los datos en SIG
52
NOTAS CLASE SIG I
pueden ser producidos de manera muy precisa, son igualmente muy exactos. Pero por ejemplo,
en el manejo de los datos a una escala 1:20000, generalmente la exactitud posicional mostrara
una zona de error alrededor del punto +/-20 m. Considerando que el uso de SIG involucra la
integración de varias coberturas de datos, comúnmente a escalas diferentes es posible ver
como los errores pueden ser fácilmente propagados durante el procesamiento.
En resumen se tiene lo siguiente:
ü Hay una necesidad creciente de documentación de errores para datos procesados por los
sistemas de información geográfica.
ü La integración de datos desde formatos diferentes (p. ej. puntos, líneas y áreas) y a
diferentes escalas que poseen errores inherentes pueden generar productos de discutible
exactitud.
ü La exactitud de un producto derivado de SIG depende de las características inherentes a
los productos fuente y a los requerimientos del usuario, tales como la escala de los
productos de salida, el método y la resolución de la modificación de los datos.
ü La mayor exactitud de cualquier producto de SIG, será la menor exactitud de la cobertura
involucrada en el análisis.
ü A medida que el numero de capas en un análisis aumenta, el numero de oportunidades de
error también aumenta.
7.2.3
Infraestructura colombiana de datos espaciales (ICDE)
En todo el mundo existen infraestructuras de datos espaciales, las cuales pueden ser de
diferentes niveles: globales, regionales y locales. La de Colombia se denomina ICDE, la cual
se basa en el reconocimiento del valor de la información y de su importancia para el desarrollo
social y económico de la nación. Esta infraestructura reconoce el valor de los datos para
construir políticas, a sabiendas de que su conocimiento permitirá generar información útil para
el manejo más adecuado de los recursos de la nación. La ICDE pretende terminar con los
problemas de datos incompletos, heterogéneos, que no pueden integrarse y que no pueden
transferirse fácilmente, ni ser accedidos por los usuarios. El desarrollo descoordinado de bases
de datos, no es bueno para la sociedad.
Una Infraestructura de datos espaciales es un conjunto de políticas, tecnologías, estándares
y recursos humanos, necesarios para adquirir, procesar, almacenar, distribuir y mejorar el uso
de los datos geoespaciales.
La iniciativa colombiana de ICDE esta impulsada por el IGAC, DANE, INGEOMINAS,
IDEAM, Min del Medio Ambiente, ECOPETROL y Otros; los cuales conformaron un comité
interinstitucional a finales de 1998. Actualmente esta en una etapa de gestión.
Dentro del comité se abordan temas relacionados con: datos, escalas, estándares y espacios a
alto nivel para traducir políticas en planes. En la parte de estándares el comité icontec – 0034
trabaja desde 1997, con una participación de cerca de 30 entidades colombianas, donde se han
definido normas valiosas, referentes a los siguientes temas:
53
NOTAS CLASE SIG I
ü
ü
ü
ü
ü
Metadatos geográficos: documentación de los datos, cuyo resultado es la norma NTC-4611
Calidad de la información geográfica (cuyo resultado es el proyecto de norma técnica
colombiana sobre la calidad de la información geográfica y cuya fuente es el comité de
trabajo ISO/TC 211 norma 517 de 1998.)
El catalogo de objetos geográficos básicos para la creación de nuevos datos (de esta forma
las entidades dejan de ser productores autónomos, pensando en las necesidades de los
usuarios y pensando que requiere ese usuario para reacomodar los datos)
Terminología (conceptos y elementos básicos de la información geográfica es decir,
lenguaje común)
Posicionamiento global
7.2.3.1
Estándares
Son un acuerdo libre y voluntario entre varias partes, respecto a especificaciones o
procedimientos en general. Son entonces, normas que pueden ser originadas como un hecho
(estándares de “facto”), como en el caso de Microsoft Office. Pueden ser de “jure” cuando
existe una entidad que tiene autoridad para hacerlo, por ejemplo ISO o en Colombia Icontec.
Existen iniciativas internacionales como el Open GIS (1995), conformado por productores de
sotfware, entidades gubernamentales, organizaciones académicas o de investigación,
proveedores de servicios y otros. Este consorcio se propone el acceso transparente a los datos
y recursos de geoprocesamiento heterogéneos, en ambientes distribuidos. Así el uso de la
información geográfica será para gente común y corriente, que requiere algo y puede tenerlo a
través de internet. El acceso transparente a los datos se logra a través de la interoperabilidad.
Las aplicaciones serán desarrolladas en tiempo real y no se requerirá ser especialista. Para más
información consulte www.opengis.org
Otras de las iniciativas es la ISO, donde el comité internacional ISO/TC 211 es el encargado
de normalizar el tema de la información geográfica, trabajando las normas de la serie 15046,
que son alrededor de 25. Su lema es obtener estándares de datos y servicios de información
geográfica que garanticen la interoperabilidad, la cual es tenida como una meta.
La serie de normas ISO 15046 se ocupa de los siguientes aspectos, entre otros:
ü
ü
ü
ü
ü
ü
ü
ü
ü
Modelo conceptual de la información geográfica expresado en lenguaje de alto nivel –
UML
Catalogo de objetos
Documentación de datos (metadatos)
Calidad de la información geográfica
Servicios de posicionamiento
Imágenes
Armonización de terminología
Certificación de personas
Perfiles (subconjuntos de las certificaciones)
54
NOTAS CLASE SIG I
En general la tecnología de la información ha ido por su lado, mientras que el SIG ha ido por
el otro, el objetivo deberá ser volver esto una sola cosa, esa unión deberá promover datos y
servicios.
Los estándares más comunes hoy en día son los de exactitud de posicionamiento y los de
exactitud temática. Para Colombia existe una resolución que es la No. 64 de 1994, por la cual
se establecen las especificaciones mínimas que deben cumplir las personas naturales o
jurídicas para realizar trabajos fotogramétricos y cartográficos en Colombia. Esas normas y las
de los otros estándares usados a nivel mundial, pueden apreciarse en la Tabla No 6.
55
Guía de estudio para el tema Calidad de la Información Geográfica
ESTÁNDARES USADOS PARA ERRORES DE POSICIONAMIENTO Y EXACTITUD TEMÁTICA
NOMBRE DEL
ESTÁNDAR
Estándar Nacional
de mapas de Estados
Unidos (NMAS)
PAÍS
GENERALIDADES
PLANIMETRÍA
ALTIMETRÍA
REPORTE
USA
1947
Estándar de calidad mínima (define
error máximo de posicionamiento).
Nivel de probabilidad asociada del
90%
Para escala de 1: 20.000 y mayores el error
máximo es de 0.85 mm. a la escala del mapa.
Para escalas menores a 1:20.000 es de 0.50
mm a la escala del mapa.
Valor límite de error:
CMAS = 2.146 * EMCircular
Para cualquier escala el error máximo
es de medio intervalo de curva de
nivel. Si las curvas están cada 25 m,
entonces el error máximo es de 12.25
m.
Valor límite de error:
VMAS = 1.645 * EMCz
Después de comparados los valores
límites de error con 0.85, 0.5 ó el
intervalo medio de curva, con el
90% de confiabilidad:
El mapa no cumple ó sí cumple el
estándar NMAS
Error admisible de medio intervalo de
curva de nivel.
Después de comparados los valores
límites de error con 0.30 ó el
intervalo medio de curva:
El mapa no cumple ó sí cumple el
estándar IGAC
La calidad del mapa se reporta
mediante etiquetas:
Se compiló para cumplir el estándar
ASPRS clase 1, 2 ó 3.
Cumple el estándar ASPRS de tal
clase.
Debe reportarse en el 95% de
confiabilidad, con una etiqueta
indicando claramente que se evaluó
y tiene un error NSSDA de tanto.
EMCircular=((EMCx + EMCy) / 2)
n
EMCx =
IGAC
Colombia
1994
Estándar de la
asociación
americana de
fotogrametría y
Percepción Remota
(ASPRS).
Estándar de
exactitud de
posición de datos
geográficos NSSDA
USA
1990
USA
1998
Estándar de
exactitud temática
del USGS (servicio
geológico de los
Estados Unifod)
Beatriz E. Alzate Atehortúa
También de calidad mínima. La
resolución 64 . Nivel de probabilidad
asociada del 90%. Es el mismo para
cualquier escala. No estipula como se
calcula el valor límite de error
Establece tolerancias de exactitud
para mapas a escala 1:20.000 o
mayores. Usa como medida el EMC.
Establece tres clases diferentes de
mapas
No define valores límites y aplica a
todo tipo de datos espaciales. Usa el
EMC. Exige que se comparen los
valores de las coordenadas en los
datos y en el terreno para un mínimo
de 20 puntos por cada conjunto de
datos. La exactitud está asociada con
una probabilidad del 95% . Es de tipo
estándares de metadatos.
Establece dos condiciones para el
porcentaje de clasificación correcta
PCC y para el índice de KIA
(considera errores debido al azar)
−
∑ ( Xi − X ) 2
i =1
n
El EMC correspondiente es 0.30 mm a la
escala del mapa.
Para posicionamiento de planos para
digitalizar el error máximo es de 1 mm. a la
escala del mapa.
Se evalúa por separado la exactitud por X y
por Y. Los valores límites del error EMC por
X y por Y son:
Clase 1: 0.25 mm a la escala del mapa
Clase 2: 0.50 mm a la escala del mapa
Clase 3: 0.75 mm a la escala del mapa
El error planimétrico se reporta de acuerdo
con la fórmula:
Exactitudh = 2.4477* ((EMCx + EMCy)/
2)
El error EMC para Z es:
Clase 1: 1/3 del intervalo de curvas
Clase 2: 2/3 del intervalo de curvas
Clase 3: 3/3 del intervalo de curvas
El error de altitud se reporta de
acuerdo con la expresión:
Exactitudv = 1.96 * EMCz
La calidad temática es Acertada si
PCC >=90% y KIA >= 85%
Página
- 1-
Descargar