viernes, 29 de mayo de 2009

Bases de Datos Geográficas - Generalidades

Antes de entrar en el ámbito geográfico, veamos en primer lugar que forma tienen las bases de datos tradicionales, es decir, las que contienen únicamente atributos alfanuméricos.

Bases de Datos Relacionales

Los Sistamas de Información Geográfica gestionan sus propias bases de datos, pero casi todos incluyen algún tipo de comunicación o enlace con las bases de datos existentes para unir atributos alfanuméricos a los datos geográficos. El modelo de base de datos de más éxito en general, y que es el utilizado por casi todos los SIG es el modelo relacional, y es el que describiremos aquí. Se debe notar sin embargo, el gran auge que las bases de datos orientadas a objetos están teniendo en estos sistemas SIG. Este es el caso de GeoThrough, que combina un motor relacional con una arquitectura orientada a Objetos.

Una base de datos relacional esta compuesta por tablas o relaciones. Una tabla tiene una serie de atributos o columnas y esta formada por filas que tienen un valor para cada uno de los atributos.

Una entidad de datos (como una entidad geográfica sin representación espacial) viene dada aquí por un conjunto de atributos que constituye una clave primaria, una identificación étnica de la entidad. Como ejemplo, los municipios son entidades de datos cuya clave primaria es su nombre o su código de municipio. Una tabla que contenga la clave primaria de una entidad y otras columnas, como por ejemplo Población, Hogares, Empresas, etc, proporciona atributos a las entidades.

Los componentes de la base de datos son, pues, muy simples, y las relaciones complejas se modelan a través de una serie de operaciones entre tablas. Estas operaciones pueden estar disponibles como algebra relacional o a través de un lenguaje del cálculo relacional. Para el usuario lo más habitual es esto último, y en concreto, el lenguaje más popular de este tipo es SQL (Structured Query Language).

Esta arquitectura es muy flexible y potente. Sin embargo esta limitada a la manipulación de valores numéricos y alfabéticos. No podemos por ejemplo determinar la longitud de carreteras que atraviesan un determinado municipio, o las empresas situadas a menos de 2 Km de un río, etc. Un lenguaje como el SQL es una buena base para un lenguaje de acceso en GIS, pero necesita operadores y funciones que actúen sobre la parte espacial de los datos, para determinar por ejemplo si una carretera atraviesa un municipio o cual es su longitud. A esto lo denominamos Operaciones Topológicas.


Bases de Datos de CAD/GIS-Elementos Geométricos

En un CAD cada archivo o diseño es una pequeña base de datos que consta fundamentalmente de elementos gráficos. Estos se pueden clasificar en puntuales, unidimensionales, y bidimensionales. Fundamentalmente puntos, líneas o polígonos además de etiquetas textuales. (No consideramos aquí los elementos tridimensionales disponibles en los sistemas actuales). A éste tipo de elementos que se encuentran en CAD los llamaremos geométricos, y también se denominan habitualmente vectoriales, por estar definidos por una serie de vectores. La información vectorial tiene la característica de conservar sus propiedades y calidad a cualquier escala de representación. Algunos sistemas de CAD permiten también incorporar en la base de datos imágenes digitales, llamados Raster o "mapas de bits", que son mosaicos de pequeños elementos de imagen rectangulares. La estructura de estas imágenes se denomina Raster ("rejilla"). En general son estructuras raster las que discretizan el espacio en una retícula regular y almacenan de alguna manera el contenido de cada rectángulo. La distinción entre estructuras vectoriales y raster es muy habitual en relación al tratamiento de datos espaciales o gráficos. Por ejemplo una foto aérea o de satélite son elementos raster, por estar compuestos de pequeños elementos o píxels.

Las bases de datos CAD están por lo general particionadas horizontal y verticalmente. Horizontalmente en el sentido de que cada archivo de CAD comprende un diseño o dibujo; una (pequeña) área rectangular u hoja. Verticalmente los elementos gráficos están compartimentadas en capas o niveles: cada elemento está en una única capa.

Estos elementos gráficos nos servirán para la descripción espacial de entidades geográficas pero no de variables espa¬ciales. La división en capas del CAD puede servir para di¬ferenciar los distintos tipos de entidades (municipios, ríos, espacios naturales en la ilustración). La separación en capas nos obligaría a duplicar una línea que, como en el ejemplo, sea a la vez límite de un municipio y curso de un río. La división en hojas nos obliga a delimitar claramente el área de estudio e incluir en el mismo archivo CAD todos los datos de interés.

Aunque no es fundamental en CAD, casi todos los sistemas avanzados permiten que estas entidades gráficas tengan algún atributo alfanumérico asociado. En particular pueden tener un identificador que sirva de enlace con tablas de datos. Sin embargo las bases de datos CAD no cuentan con posibilidades de acceso análogas a las de las bases de datos Relacionales. Habitualmente no permiten realizar una interrogación con criterios espaciales para determinar que objetos gráficos la cumplen, y mucho menos incluir condiciones sobre los datos alfanuméricos que puedan estar asociados a los gráficos. Las necesidades de un SIG se parecen conceptualmente mucho más a las de una base de datos que a las de un sistema CAD.


Elementos Geométricos con Atributos

La idea presentada antes de unir atributos alfanuméricos a elementos gráficos del tipo de los usados en CAD puede ser suficiente para diseñar una sencilla base de datos geográfica si se establece un sistema de archivo que gestione las particularidades de las coordenadas geográficas y no se estructura la información en hojas y capas, sino en conjuntos de datos superponibles.

En una estructura de este tipo cada entidad geográfica estará representada por un elemento geométrico y los atributos alfanuméricos asociados.

Los distintos tipos de entidades geográficas estarían representados por conjuntos de datos con atributos y geometría homogéneos. Así por ejemplo el conjunto de los términos municipales (un tipo de entidad geográfica) tendrán una serie de atributos comunes (nombre del municipio, población, etc) y una representación geométrica homogénea (polígonos que encierran el término).

Tablas de datos con objetos espaciales

Esta sencilla estructura de datos (atributos con geometría) puede servir de implementación para un modelo de base de datos geográfica que nace de manera natural de ella y resulta muy útil por su sencillez y flexibilidad.

El modelo que vamos a describir es una extensión natural de una base de datos relacional. La información estará estructurada en tablas al igual que en el modelo relacional. Las tablas correspondientes a los conjuntos de datos homogéneos descritos antes. A los tipos de atributos habituales -números y textos- que aparecen en las tablas se añade aquí uno nuevo: el objetivo espacial, de forma que cada tabla pueda tener como máximo una columna de este tipo, que representa el elemento geométrico asociado a los atributos, es decir la parte espacial de la entidad geográfica. De ésta manera una tabla puede contener elementos geográficos completos, incluyendo atributos y geometría.

Para ser útil esta estructura se debe contar con un medio de acceso que combine los atributos y la geometría, teniendo en cuenta que los objetivos tienen como referencia común un espacio geométrico, y por tanto existen relaciones implícitas entre los objetos espaciales: una carretera atraviesa un municipio contiene un hospital, una carretera enlaza con otra, etc. La forma habitual y más versátil de proporcionar esta funcionalidad es mediante un lenguaje de acceso que proporcione operadores y funciones espaciales.


Habitualmente este lenguaje es una extensión del SQL visto antes.
Dado que se ha incorporado el objeto espacial como un nuevo tipo fundamental de datos bastaría extender de funciones y operadores disponibles en el lenguaje para operar sobre datos numéricos y textuales con otros operadores y funciones que operen sobre objetos espaciales. Las funciones pueden extraer atributos como la longitud de un objeto lineal o el área de uno extenso, o pueden construir un objeto que sea la unión o intersección de otros dos, etc. Se pueden definir operadores lógicos que determinen si dos objetos se intersectan, uno esta incluido en otro, etc.

Con esta estructura, el usuario que visualiza y analiza los datos trabaja sobre elementos de máxima sencillez. La abstracción de manipular la expresión espacial de los datos como objetos grafico -un tipo más de atributo- permite un modelo sumamente simple y útil. Independientemente de la estructura subyacente de los datos la visión de éstos como tablas es la forma ideal para un sistema de análisis y visualización como son los llamados Desktop Mapping.

Sin embargo la estructura que hemos descrito para dar soporte a estas "tablas con objetos" limita las posibilidades del sistema y en algunos casos afecta a su eficiencia. Para que las operaciones espaciales, esto es, la determinación de las relaciones geométricas de los objetos sean eficientes y rápidas, las tablas tienen que estar dotadas de un sofisticado mecanismo de indexación espacial.

No hay comentarios:

Publicar un comentario