¿Qué son los datos Raster y Vector en SIG y cuándo usarlos?

47

¿Qué son los datos ráster y vectoriales en el contexto SIG?

En términos generales, ¿para qué aplicaciones, procesos o análisis son adecuados? (¡y no apto para!)

¿Alguien tiene algunas imágenes pequeñas, concisas y efectivas que transmiten y contrastan estas dos representaciones de datos fundamentales?

wilkie mate
fuente

Respuestas:

34

Datos vectoriales

Ventajas: los datos se pueden representar en su resolución y forma originales sin generalización. La salida gráfica suele ser más agradable estéticamente (representación cartográfica tradicional); Dado que la mayoría de los datos, por ejemplo, mapas impresos, están en forma vectorial, no se requiere conversión de datos. Se mantiene la ubicación geográfica precisa de los datos. Permite una codificación eficiente de la topología y, como resultado, operaciones más eficientes que requieren información topológica, por ejemplo, proximidad, análisis de red.

Desventajas: la ubicación de cada vértice debe almacenarse explícitamente. Para un análisis efectivo, los datos vectoriales deben convertirse en una estructura topológica. Esto a menudo requiere un procesamiento intensivo y generalmente requiere una limpieza de datos exhaustiva. Además, la topología es estática, y cualquier actualización o edición de los datos del vector requiere la reconstrucción de la topología. Los algoritmos para las funciones de manipulación y análisis son complejos y pueden ser intensivos en procesamiento. A menudo, esto limita inherentemente la funcionalidad para grandes conjuntos de datos, por ejemplo, una gran cantidad de características. Los datos continuos, como los datos de elevación, no se representan efectivamente en forma de vector. Por lo general, se requiere una generalización o interpolación de datos sustancial para estas capas de datos. El análisis espacial y el filtrado dentro de polígonos es imposible

Datos ráster

Ventajas: la ubicación geográfica de cada celda está implícita en su posición en la matriz de la celda. En consecuencia, aparte de un punto de origen, por ejemplo, la esquina inferior izquierda, no se almacenan coordenadas geográficas. Debido a la naturaleza de la técnica de almacenamiento de datos, el análisis de datos suele ser fácil de programar y rápido de realizar. La naturaleza inherente de los mapas ráster, por ejemplo, mapas de un atributo, es ideal para el modelado matemático y el análisis cuantitativo. Los datos discretos, por ejemplo, los rodales forestales, se acomodan igualmente bien que los datos continuos, por ejemplo, los datos de elevación, y facilitan la integración de los dos tipos de datos. Los sistemas de celdas de cuadrícula son muy compatibles con dispositivos de salida basados ​​en ráster, por ejemplo, trazadores electrostáticos, terminales gráficos.

Desventajas: el tamaño de la celda determina la resolución a la que se representan los datos .; Es especialmente difícil representar adecuadamente características lineales dependiendo de la resolución de la celda. En consecuencia, los enlaces de red son difíciles de establecer. El procesamiento de datos de atributos asociados puede ser engorroso si existen grandes cantidades de datos. Los mapas ráster reflejan inherentemente solo un atributo o característica para un área. Dado que la mayoría de los datos de entrada están en forma de vector, los datos deben experimentar una conversión de vector a ráster. Además de los mayores requisitos de procesamiento, esto puede presentar problemas de integridad de datos debido a la generalización y la elección del tamaño de celda inapropiado. La mayoría de los mapas de salida de los sistemas de celdas de cuadrícula no se ajustan a las necesidades cartográficas de alta calidad.

Mapperz
fuente
19

Píxeles frente a coordenadas Cuando pienso en mapas ráster, mi primer pensamiento son las imágenes satelitales. Casi cada píxel en una imagen satelital detallada de un área urbana podría contener información única. Un único mosaico en un mapa web (típicamente una variante de Mercator referida libremente como " Mercator esférico " o " Mercator web " y compatible con Google , Bing , Yahoo, OSM y ESRI) generalmente tiene 256 x 256 = 65.536 píxeles, y cada uno el nivel de zoom tiene mosaicos (2 ^ zoom * 2 ^ zoom) . Cuando pienso en Vector, pienso en polígonos y líneas. Por ejemplo, un archivo de forma que detalla los límites de zonificación de un área de una ciudad entera (potencialmente millones de mosaicos Raster) podría tener solo 65,000 formas vectoriales.

Escala precisa Parece que usted (y probablemente la mayoría de los lectores) ya conoce la diferencia más obvia entre los píxeles fijos de trama y el vector (mapas de coordenadas). Los dibujos vectoriales (y los mapas) pueden escalar con un mayor grado de fidelidad que los píxeles porque los datos vectoriales contienen patrones de coordenadas (puntos, polígonos, líneas, etc.) que pueden representarse entre sí en diferentes resoluciones usando fórmulas simples, mientras que el cambio de tamaño de píxeles generalmente usa un algoritmo de suavizado que da como resultado artefactos de imagen.

Compresión de imagen frente a compresión de estructura En la práctica, la mayoría de las imágenes no tienen píxeles únicos al 100%, se pueden comprimir en paquetes de datos más pequeños, y muchos archivos vectoriales contienen detalles en exceso que no son necesarios en muchos niveles de zoom de bajo detalle. La compresión de imágenes es un proceso bien conocido y muy eficiente, y casi todas las bibliotecas de codificación han incorporado clases para hacer este trabajo. La compresión de coordenadas vectoriales, o "simplificación de la geometría", es un poco menos común (ya que el SIG en general es un poco menos común que la manipulación general de imágenes). En mi experiencia, pasará cerca de 0 horas pensando en la compresión de imágenes (simplemente desactívela o enciéndala) y considerablemente más tiempo pensando en la compresión espacial. Echa un vistazo al algoritmo Douglas Peucker para ver ejemplos, o simplemente juega con QGIS y algunos archivos de límites del censo.

Representación del lado del cliente frente al servidor Finalmente, todo lo que se ve en una computadora se representa en píxeles en la pantalla con una resolución particular (es decir, nivel de zoom). A menudo (especialmente en la web) el desafío es poner esos píxeles frente a los usuarios de la manera más eficiente posible. Los archivos de forma de grupo del bloque censal de EE.son particularmente interesantes porque están justo por encima del límite de los conjuntos de datos vectoriales que son "demasiado grandes" para representarse en un navegador web como datos vectoriales. En contraste, los condados de EE. UU. Apenas pueden representarse en navegadores modernos como una descarga de vectores. Si bien un archivo de forma vectorial del Grupo del bloque del censo de los EE. UU. Sin duda sería más pequeño que un conjunto de mosaicos ráster renderizado para cubrir todo el territorio estadounidense con múltiples niveles de zoom, el archivo de la Forma del grupo del bloque de bloques es demasiado grande (cerca de 1 GB) para que un navegador web lo descargue según la demanda. Incluso si el navegador web pudiera descargar el archivo rápidamente, la mayoría de los navegadores web (incluso usando flash) son bastante lentos cuando se representan grandes cantidades de formas. Por lo tanto, para ver grandes conjuntos de datos vectoriales, a menudo es mejor traducirlos en imágenes comprimidas para su transmisión al navegador web.

Algunos ejemplos prácticos Hace unos días respondí una pregunta similar sobre la representación de grandes conjuntos de datos en Google Maps. Puede ver la pregunta y un análisis detallado de las "mejores prácticas" tal como las usa el NY Times y otros hoy aquí .

Hace unos años, decidí hacer la transición de la representación de vectores del lado del cliente pesado del flash a la representación de vectores del lado del servidor que ofrece mosaicos de imágenes comprimidas a html y JavaScript puros. Tenemos una galería de mapas con varias versiones de Html + Raster (mosaicos de imágenes generadas por el servidor) y Flash + Vector (renderizado pesado del lado del cliente).

Glenn
fuente
10

Mostrar los mismos datos en ambos formatos a veces puede ser útil para comprender sus diferencias inherentes:

Raster vs. Vector vs. Vida Real

Me gustó mucho esto, más tarde en la misma presentación .pdf: Buscaminas Ejemplo de análisis Fuente : Juniper GIS

Roy
fuente
8

Parece que está buscando una manera de expresar esto a personas no técnicas, ¿tal vez? Podría usar una analogía con dos elementos de la infancia, papel cuadriculado y un rompecabezas de conectar los puntos. Cada cuadrado en una hoja de papel cuadriculado corresponde a una celda de trama, así que imagina colorear cada cuadrado o poner un número en él. Los datos vectoriales son un rompecabezas de conectar los puntos. En ambos casos, cada capa es simplemente otra hoja de papel.

Jersey Andy
fuente
5

Esta imagen da una buena idea de la representación de datos ráster vs. vector.

ingrese la descripción de la imagen aquí En Rastor, el área bajo consideración se divide en cuadrados iguales y se le asigna una característica. Entonces, si considera crear una estructura de datos para el rastreador, sería una matriz 2D, cada coordenada x, y se refiere a un cuadrado en el área y puede tener una cierta característica predefinida, por ejemplo, construcción, carretera, vegetación, cuerpo de agua, etc.

En Vector, los datos se representan en términos de puntos, líneas y polígonos. Por lo tanto, un lugar turístico se representa como un PUNTO (x, y), un río o una carretera representada como una cadena de línea (que es una serie de puntos conectados), un lago o un estadio, etc., representado como un polígono (Lista de puntos que forman un área cerrada) - Lea más aquí: https://en.wikipedia.org/wiki/Well-known_text

¡Las imágenes son de búsqueda web, había tomado capturas de pantalla en ese momento y no tengo enlaces a la fuente original en la web ahora! Disculpas por eso!

Pero espero que esta respuesta ayude a explicarlo a una persona nueva en GIS: D

Dhanashri
fuente
0

Es mejor pensar en los datos ráster como un tipo especial de datos vectoriales. En los datos vectoriales, las líneas en el mapa están determinadas por un fenómeno particular. En los datos ráster, esta delineación se define mediante una cuadrícula arbitraria que es independiente de los fenómenos que intenta mapear. Típicamente, esta cuadrícula es el resultado de la forma en que un sensor particular captura información (como una cámara). Pero en todos los casos, los datos ráster también se pueden representar por vector.

Matthew Snape
fuente
Es tan inusual caracterizar los datos ráster como una instancia de datos vectoriales que debería considerar amplificar y justificar esta afirmación.
whuber
@whuber Estoy de acuerdo en que falta mi justificación. Es técnicamente cierto que el ráster se puede expresar en forma de vector. Ese hecho ayuda a comprender, pero quizás no sea prácticamente útil.
Matthew Snape
No veo cómo pensar en la trama como un tipo especializado de vector es útil para comprender. ¿Podría por favor explicar cómo esta perspectiva le ha ayudado?
Matt Wilkie
es útil porque fomenta un enfoque de mente abierta para usar herramientas. Los SIG están llenos de datos especializados para un uso particular, como TIN, redes o incluso nombres de lugares. Todos se pueden expresar en términos de geometría simple, y los rásteres no son diferentes. Un buen ejemplo es usar un ráster como índice para un conjunto de datos vectoriales. Es contrario a la intuición y también enormemente más rápido para operaciones de identificación simples.
Matthew Snape
Aunque los datos vectoriales pueden parecer datos ráster en un mapa, los dos son fundamentalmente diferentes para el análisis. La prueba está en considerar algunas capacidades básicas. Por ejemplo , para un ráster de n celdas, la obtención del valor en un índice arbitrario de fila y columna se realiza con una búsqueda de acceso aleatorio que toma tiempo O (1). Con una representación vectorial, los mismos valores requieren una búsqueda a través de un índice, lo que toma tiempo O (log (n)). Otro ejemplo: cambiar un ráster toma O (1) tiempo, porque solo sus coordenadas de origen deben cambiar. El mismo cambio en una representación vectorial es O (n).
whuber
0

La representación de datos ráster a veces se denomina representación de datos de cuadrícula. Se utiliza para representar datos geográficos o información mediante el uso de filas y columnas en las que cada celda representa datos digitales con una representación específica.

JESTO
fuente