LECCIN 4: CALIDAD DE LOS DATOS GEOGRFICOS:

Anuncio
TEMA 6: CALIDAD DE LOS DATOS GEOGRÁFICOS:
OBJETIVOS DEL TEMA
¾ Diferenciar entre los conceptos, error, exactitud y precisión.
¾ Conocer los diferentes componentes de la calidad de los datos geográficos.
¾ Comprender las posibles fuentes de error en los Sistemas de Información
Geográfica.
1. INTRODUCCIÓN
Los datos geográficos contienen siempre algún tipo de error, referido a
alguna de sus cuatro componentes: espacial, temática, de relación o temporal.
El error puede ser considerado como desviación o distancia entre un valor
medio y un valor real. En esta línea, el término exactitud se refiere a la
proximidad de una observación a su valor real (Chrisman, 1991). Este término
no debe ser confundido con el de precisión, que se refiere al número de
decimales con el que se efectúa una medición. En principio es alcanzable la
precisión que se desee, si bien en la práctica existe la limitación del número de
bits que se utilizan para representar un valor en el ordenador.
El establecimiento de unos ciertos niveles de calidad está en función de
las necesidades reales del estudio que se realice. Evidentemente, una mayor
exactitud posicional conlleva un coste mayor, lo que no siempre está justificado
de acuerdo con los objetivos del estudio que se realice. Atendiendo a la
relación entre coste y calidad, el nivel optimo para un estudio coincide con el
nivel de calidad mínimo requerido para el mismo. Un incremento del nivel de
calidad por encima de ese mínimo supone tener que soportar un coste
adicional innecesario. Conviene considerar, además, que el aumento de los
costes no tiene por qué ser proporcional al incremento de calidad: a partir de
unos determinados niveles de calidad, un pequeño incremento de calidad
puede significar un aumento desproporcionado de los costes.
2.- COMPONENTES EN LA CALIDAD DE LOS DATOS
Se pueden diferenciar los siguientes componentes de calidad en los
datos:
¾ Exactitud posicional
¾ Exactitud temática
¾ Consistencia lógica
¾ Temporalidad
¾ Integridad
2.1.- Exactitud Posicional.
La exactitud posicional se refiere a la exactitud en la localización de los
elementos sobre el plano en relación con la posición que realmente ocupan en
el espacio. En la localización de un punto, un error de 1 mm sobre un plano
1:10.000 supone una diferencia de 10 metros en la realidad. La exactitud
posicional se puede verificar sobre una serie de puntos, de los que se conoce
exactamente su localización real en el espacio. Una forma de medirla es
determinar el error posicional de esos puntos elevando al cuadrado las
desviaciones individuales y obteniendo la raíz cuadrada de su media. Algunas
instituciones han fijado unos estándares para controlar los errores relacionados
con la exactitud posicional, de manera que el usuario final conozca hasta qué
punto es exacta la localización de los puntos de un mapa.
2.2.- Exactitud Temática.
La exactitud temática hace referencia a la exactitud de los valores de los
atributos. Cuando se trabaja con variables cuantitativas, como la altitud o el
número de habitantes, se sabe que casi nunca la información es del todo
exacta, ya que siempre existe un cierto nivel de error tanto en la medición de
los datos del medio físico como en las estadísticas oficiales de carácter
socioeconómico. De la misma forma, cuando nos enfrentamos a variables
cualitativas, como el uso del suelo, conocemos previamente que existe un
cierto nivel de inexactitud: un polígono industrial puede no ser industrial al 100
% y un bosque de pinos puede no contener exclusivamente pinos en el 100 %
de su superficie. Un caso muy ilustrativo es el de la clasificación de imágenes
de satélite, donde el valor cuantitativo de cada tesela es asimilado a una clase
de uso del suelo, en función de la diferencia que ese valor presente con
respecto a un valor que se considera prototipo de esa clase, es decir, en
función de un cierto error tolerable, con lo que de hecho se acepta de
antemano un cierto grado de inexactitud temática (ver Chisman, 1989).
2.3.- Consistencia Lógica.
La consistencia lógica hace referencia a las relaciones descritas en la
estructura de datos. En general se trata de errores que pueden ser detectados
cuando el sistema genera topología. Así, por ejemplo, un polígono tiene que
ser cerrado y tener una única etiqueta y un solo identificador, y dos líneas
deben tener un nodo como punto de enlace. No sólo debe haber una
consistencia lógica dentro de cada capa, sino también entre las distintas capas.
Supongamos que tenemos dos capas temáticas (secciones censales e
hidrografía) y que un río marca el límite entre dos secciones censales: al
superponer ambas capas debería coincidir el trazado del río con el límite entre
ambas secciones censales y sin embargo frecuentemente esto no ocurre así.
En tal caso no existiría consistencia lógica entre ambas capas.
2.4.-Temporalidad.
El tiempo es una componente esencial de los datos geográficos y por lo
tanto afecta a la propia calidad de los datos. En general la información debe ser
lo más actualizada posible y toda ella estar referida al mismo tiempo. Pero esto
no siempre es posible, ya que con frecuencia se utilizan fuentes que son
actualizadas cada ciertos períodos de tiempo, como la cartografía oficial o los
datos censales. En muchas actividades, especialmente en las de gestión, es
fundamental una constante labor de actualización para que la base de datos
sea útil. Es lo que ocurre, por ejemplo, en las aplicaciones en la gestión
urbanística o en los inventarios para el mantenimiento de carreteras. A veces
no se presta la suficiente atención al tiempo cuando se recoge información de
distintas fuentes, con la consecuencia de que ésta puede ser inconsistente
(Aronoff, 1989).
2.5.- Integridad.
Se deben tener en cuenta determinados criterios durante el proceso de
creación de la base de datos para que ésta sea coherente y homogénea. Esos
criterios
se
refieren
a
cuestiones
como
qué
elementos
deben
ser
seleccionados, que dimensiones mínimas deben tener para que sean incluidos,
en cuántas clases se divide una variable nominal, cuáles son las definiciones
de las clases, etc. El fijar y aplicar de forma adecuada estos criterios hace que
la base de datos sea homogénea en su totalidad.
3.- TIPOS DE ERRORES
Los errores son consustanciales a los datos. No es posible encontrar ni
un mapa analógico ni una base de datos espacial sin errores. La cuestión que
se plantea no es eliminar el error, sino ser capaces de controlarlo. Los errores
pueden surgir en distintas etapas de la representación de la realidad y el
análisis en un SIG, en función de lo cual Aronoff (1989) presenta una tipología
en la que sólo las cuatro primeras categorías se refieren propiamente a errores
en la base de datos
3.1.- Errores inherentes a la recogida de información.
Tanto los mapas como las estadísticas oficiales contienen forzosamente
un cierto nivel de error, que se incorpora lógicamente a la base de datos
espacial que se genera. Algo semejante sucede cuando se recurre al trabajo de
campo o la interpretación de imágenes de satélite, en las que también es
frecuente que se introduzcan ciertos niveles de error ligados a la medición o a
la clasificación.
3.2.- Errores derivados de la captura de datos.
En los procesos de captura de datos en el ordenador se pueden generar
errores que no existen en las fuentes originales. Esto puede ocurrir en un
proceso de digitalización manual, donde puede quedar un polígono sin
representar; o en la importación de ficheros con información locacional o de
atributos, donde un determinado carácter alfanumérico puede no ser
reconocido por el sistema. Por otro lado, es importante observar que en
algunos casos nos encontramos con inexactitudes ligadas a una indefinición o
variabilidad de las líneas frontera en la propia realidad. Si el error es
considerado como la desviación (o distancia) entre un valor medio y el valor
real, en este caso no existe un valor real determinado y con el que efectuar las
comparaciones. Esto puede ser debido a que en la realidad no existe una línea
frontera entre dos áreas sino una suave transición (por ejemplo, entre dos
clases de vegetación potencial) o a que esa línea frontera es cambiante en el
tiempo (por ejemplo la línea de costa de un embalse que varía a lo largo del
año y en ciclos plurianuales, en función de las precipitaciones).
3.3.- Errores derivados del almacenamiento
Las coordenadas de los puntos se almacenan en formato digital con un
determinado nivel de precisión. Cuando se almacenan en simple precisión se
utilizan 32 bits (4 bytes) de memoria para cada valor y se puede trabajar con
siete dígitos significativos. La doble precisión utiliza 64 bits, pero permite
trabajar con 15 ó 16 dígitos significativos. En algunas aplicaciones se requiere
una gran exactitud en el almacenamiento de las coordenadas, que solo puede
ser alcanzada utilizando doble precisión, si bien ello conlleva un mayor
consumo de memoria.
3.4.- Errores derivados de la manipulación y análisis de datos.
Pueden surgir, por ejemplo, cuando varias capas se superponen y no
coinciden exactamente ciertas líneas que deberían hacerlo, formándose
polígonos que en realidad no existen, los polígonos ficticios. Cuanto más
precisa sea la forma de estas líneas frontera, más fácil es que se produzcan
errores en las operaciones
de superposición de capas. Por otro lado, los
errores tienden a incrementarse en número cuanto mayor es la cantidad de
capas a superponer.
3.5.- Errores debidos a las salidas cartográficas
El error puede ser debido tanto a los dispositivos de salida como al
material sobre el que se realiza la impresión. Los monitores de los ordenadores
y los plotter o trazadores trabajan con un sistema de coordenadas que tienen
una precisión limitada, lo que puede producir ciertas imprecisiones en las
salidas cartográficas. Por otra parte, en material (generalmente papel) en el
que se realiza la impresión es deformable en mayor o menor medida.
3.6.- Errores debidos a la utilización de los resultados.
Los mapas o informes generados por un SIG pueden ser utilizados de
forma inapropiada, sin considerar el nivel de exactitud con el que se ha
trabajado, lo que puede llevar a conclusiones equivocadas.
RESUMEN DEL TEMA 6
¾ El error es la desviación o distancia entre un valor medio y el valor real.
¾ La exactitud es la proximidad de una observación a su valor real.
¾ La precisión es el número de decimales con el que se efectúa la medición.
¾ Componentes de calidad de los datos:
¾ Exactitud posicional
¾ Exactitud temática
¾ Consistencia lógica
¾ Temporalidad
¾ Integridad
¾ La exactitud posicional es la fidelidad en la localización de los elementos
geográficos sobre el plano en relación con la posición que realmente
ocupan en el espacio.
¾ La exactitud temática hace referencia a la precisión en la definición de los
valores de los atributos.
¾ La consistencia lógica hace referencia a la calidad de las relaciones
descritas en la estructura de datos.
¾ La temporalidad de los datos es una componente esencial que afecta a la
propia calidad de los datos. En general la información debe ser lo más
actualizada posible y toda ella estar referida al mismo tiempo.
¾ La integridad lógica de los datos se consigue fijando determinados criterios
durante el proceso de creación de la base de datos para que ésta sea
coherente y homogénea.
¾ Tipos de errores y sus fuentes:
Etapas
Fuentes de error
Errores en la recogida de información
en el trabajo de campo.
Errores
Recogida de datos
en
utilizados
los
mapas
como
existentes
fuentes
de
información.
Errores en el análisis de los datos de
imágenes de satélite.
Inexactitudes
causadas
Captura de datos
por
en
el
la
digitalización
operador
o
los
a
los
equipos.
Inexactitudes
inherentes
elementos geográficos.
Almacenamiento
Insuficiente precisión numérica.
Insuficiente precisión espacial.
Intervalos de clase inapropiados.
Errores en líneas frontera.
Manipulación
Propagación de errores por múltiples
superposiciones de mapas.
Polígonos ficticios causados por l
superposición de mapas.
Inexactitudes en las escalas.
Errores causados por inexactitudes del
Salidas cartográficas
dispositivo gráfico de salida.
Errores causados por la deformación
del material cartográfico.
La
Uso de los resultados
información
puede
ser
incorrectamente entendida.
La información puede ser utilizada de
forma inapropiada.
Descargar