Tengo un cuadrado 2D y tengo un conjunto de puntos dentro, digamos, 1000 puntos. Necesito una forma de ver si la distribución de puntos dentro del cuadrado está extendida (o más o menos uniformemente distribuida) o si tienden a reunirse en algún lugar dentro del cuadrado.
Necesito una forma matemática / estadística (no de programación) para determinar esto. Busqué en Google, encontré algo como bondad de ajuste, Kolmogorov, etc., y me pregunto si hay otros enfoques para lograr esto. Necesito esto para el trabajo de clase.
Entradas: un cuadrado 2D y 1000 puntos. Salida: sí / no (sí = distribuido uniformemente, no = reuniéndose en algunos puntos).
distributions
probability
spatial
point-process
camioneta
fuente
fuente
R
, hay muchas herramientas para esta tarea .Respuestas:
Creo que la idea de @John de una prueba de chi = cuadrado es un camino a seguir.
Desearía parches en 2-d, pero desearía probarlos usando una prueba de chi-cuadrado de 1 vía; es decir, los valores esperados para las celdas serían donde N es el número de células.1000norte
Pero es posible que un número diferente de células arroje conclusiones diferentes.
Otra posibilidad es calcular la distancia promedio entre puntos y luego comparar esto con los resultados simulados de ese promedio. Eso evita el problema de un número arbitrario de celdas.
EDITAR (más sobre la distancia promedio)
Con 1000 puntos, hay distancias por pares entre puntos. Estos se pueden calcular (usando, por ejemplo, la distancia euclidiana). Estas distancias pueden ser promediadas.1000 ∗ 9992
Luego puede generar N (un gran número) de conjuntos de 1000 puntos que están distribuidos uniformemente. Cada uno de esos N conjuntos también tiene una distancia promedio entre puntos.
Compare los resultados de los puntos reales con los puntos simulados, ya sea para obtener un valor p o simplemente para ver dónde caen.
fuente
Otra posibilidad es una prueba de Chi-cuadrado. Divida el cuadrado en parches no superpuestos de igual tamaño, y pruebe los recuentos de los puntos que caen en los parches contra sus recuentos esperados bajo una hipótesis de uniformidad (la expectativa de un parche es total_points / total_patches si todos son del mismo tamaño) , y aplique la prueba de chi-cuadrado. Para 1000 puntos, 9 parches deberían ser suficientes, pero es posible que desee utilizar más granularidad dependiendo de cómo se vean sus datos.
fuente
¿Por qué no usar la prueba de Kolmogorov-Smirnov? Eso es lo que haría, especialmente teniendo en cuenta que el tamaño de su muestra es lo suficientemente grande como para compensar la falta de potencia.
Alternativamente, podrías hacer alguna simulación. No es riguroso, pero proporciona alguna evidencia sobre si los datos están distribuidos uniformemente.
@whuber La extensión bidimensional del KS es bien conocida (ver aquí ). En este caso, estamos investigando si estos 1000 dibujos (coordenadas (x, y)) podrían extraerse de la distribución bidimensional uniformemente conjunta, al menos así es como leo "distribuido uniformemente". @John podría haberme expresado torpemente (ni las matemáticas ni el inglés son mis primeros idiomas) Lo que quise decir es que el valor p exacto se puede calcular usando una prueba como el KS, mientras que el valor p (o como se llame el equivalente) solo tiende asintóticamente al hacer simulaciones.
fuente