Puntos de datos dados con longitud, latitud y un tercer valor de propiedad de este punto. ¿Cómo puedo agrupar puntos en grupos (subregiones geográficas) en función del valor de la propiedad? Busqué en Google y descubrí que este problema parece llamarse "agrupamiento restringido espacial" o "regionalización". Sin embargo, no estoy familiarizado con el manejo de datos geográficos y no tengo idea de qué tipo de algoritmos son buenos y qué paquetes de python / R son buenos para esta tarea.
Para dar una idea más intuitiva sobre lo que quiero, digamos que mis diagramas de dispersión de datos son los siguientes:
Por lo tanto, cada punto es un punto, x es la longitud, y es la latitud y el mapa de colores muestra si el valor es grande o pequeño. Quiero dividir esos puntos en subregiones / grupos / grupos según la ubicación y la similitud de valores. Como el siguiente (no es exactamente lo que quiero, solo para mostrar una idea intuitiva):
Entonces, ¿cómo puedo lograr esto?
fuente
Respuestas:
El paquete rioja proporciona funcionalidad para la agrupación jerárquica restringida. Para lo que está pensando como "limitado espacialmente", especificaría sus cortes en función de la distancia, mientras que para la "regionalización" podría usar k vecinos más cercanos. Recomiendo encarecidamente proyectar sus datos para que estén en un sistema de coordenadas basado en la distancia.
fuente