Uno de los aspectos más importantes de una base de datos equipada con SIG es que proporciona al usuario la capacidad de consultar rápidamente todos los puntos dentro de un área geográfica arbitraria que coincidan con algunos criterios adicionales. (Por ejemplo, "Búscame los 3 restaurantes más cercanos a este punto en un mapa").
¿Alguien puede señalarme una discusión teórica de los algoritmos involucrados? Quiero aprender cómo funcionan.
En última instancia, quiero aplicar la misma capacidad a conjuntos generalizados de datos numéricos: una gran nube de puntos en un espacio arbitrario, n-dimensional y no euclidiano. Por ejemplo, la cara de una persona puede caracterizarse como un vector de números: [distancia entre los ojos, distancia del ojo a la boca, ancho de la cara, longitud de la cara, etc.]. Quiero filmar el tráfico de la acera, estimar las características de la cara de cada persona y luego poder hacer consultas a los datos más adelante, como "dada la cara de esta persona, encuéntrame las 100 caras más similares".
¿Existe actualmente algún software existente que brinde la capacidad de buscar en estos espacios generalizados?
He oído que Netezza ha implementado algunos innovadores algoritmos de procesamiento espacial paralelo. El libro blanco está aquí .
Actualizar
Olvidé mencionar que Netezza aprovecha en gran medida el teorema de Bayes . Aquí hay una colección de videos aquí .
fuente