Tengo que calcular el porcentaje de pendiente ascendente promedio para un gran conjunto de datos, el método básico se detalla aquí. Sin embargo, comencé a preguntarme si la media armónica podría ser más apropiada que la media aritmética estándar, ya que técnicamente es una tasa de cambio. No he visto que esto aparezca en ninguna de las otras discusiones sobre promediar la pendiente sobre puntos, áreas, líneas, etc. Debería ser bastante sencillo de lograr.
editar: El propósito de calcular la pendiente promedio en este caso es generar un parámetro (de muchos) para usar en el modelado de umbrales de inicio de canal. Tengo un conjunto de ubicaciones de cabecera de canal recopiladas en el campo en las que recolectaré la acumulación de flujo, varios parámetros promedio de pendiente ascendente, etc., y usaré la regresión lineal múltiple para tratar de describir los umbrales de acumulación en términos de los otros parámetros.
fuente
Respuestas:
La pendiente promedio suena como una cantidad natural, pero es algo bastante extraño. Por ejemplo, la pendiente promedio de una llanura horizontal plana es cero, pero cuando agrega un poco de ruido aleatorio promedio cero a un DEM de esa llanura, la pendiente promedio solo puede subir. Otros comportamientos extraños son la dependencia de la pendiente promedio de la resolución DEM, que he documentado aquí , y su dependencia de cómo se creó el DEM. Por ejemplo, algunos DEM creados a partir de mapas de contorno están en realidad ligeramente en terrazas, con pequeños saltos abruptos donde se encuentran las líneas de contorno, pero por lo demás son representaciones precisas de la superficie en general. Esos saltos abruptos, si se les da demasiado o muy poco peso en el proceso de promedio, pueden cambiar la pendiente promedio.
Destacar la ponderación es relevante porque, en efecto, una media armónica (y otros medios) están ponderando diferencialmente las pendientes. Para entender esto, considere la media armónica de solo dos números positivos x e y . Por definición,
donde los pesos son a = y / (x + y) y b = x / (x + y). (Merecen llamarse "pesos" porque son positivos y suman unidad. Para la media aritmética, los pesos son a = 1/2 yb = 1/2). Evidentemente, el peso unido a x , igual a y / (x + y), es grande cuando x es pequeño en comparación con y . Así armónico significa sobrepeso los valores más pequeños .
Puede ayudar a ampliar la pregunta. La media armónica es una de una familia de promedios parametrizados por un valor real p . Así como la media armónica se obtiene promediando los recíprocos de x e y (y luego tomando el recíproco de su promedio), en general podemos promediar las potencias pth de x e y (y luego tomar la potencia 1 / pth del resultado ) Los casos p = 1 y p = -1 son las medias aritméticas y armónicas, respectivamente. (Podemos definir una media para p = 0 tomando límites y así obtener la media geométrica como miembro de esta familia también). Como pdisminuye de 1, los valores más pequeños están cada vez más ponderados; y a medida que p aumenta de 1, los valores más grandes están cada vez más ponderados. Se deduce que la media solo puede aumentar a medida que aumenta p y debe disminuir a medida que disminuye p . (Esto es evidente en la segunda figura a continuación, en la que las tres líneas son planas o aumentan de izquierda a derecha).
Con una visión práctica del asunto, podríamos estudiar el comportamiento de varios medios de pendientes y agregar este conocimiento a nuestra caja de herramientas analíticas: cuando esperamos que las pendientes entren en una relación de tal manera que las pendientes más pequeñas deberían recibir más una influencia, podríamos elegir una media con p menor que 1; y, por el contrario, podríamos aumentar p por encima de 1 para enfatizar las pendientes más grandes. Para este fin, consideremos varias formas de perfiles de drenaje en la vecindad de un punto.
Para mostrar lo que podría pasar, he considerado tres terrenos locales cualitativamente diferentes : uno es donde todas las pendientes son iguales (lo que hace una buena referencia); otro es donde localmente estamos ubicados en el fondo de un tazón: a nuestro alrededor las pendientes son cero, pero luego aumentan gradualmente y eventualmente, alrededor del borde, se vuelven arbitrariamente grandes. Lo contrario de esta situación ocurre cuando las pendientes cercanas son moderadas pero luego se nivelan lejos de nosotros. Eso parecería cubrir una amplia gama de comportamientos realistas.
Aquí hay gráficos pseudo-3D de estos tres tipos de formas de drenaje:
Aquí he calculado la pendiente media de cada uno, con la misma codificación de color, en función de p , dejando que p oscile entre -1 (media armónica) y 2.
Por supuesto, la línea azul es horizontal: no importa qué valor tome p , la media de una pendiente constante no puede ser otra que esa constante (que se ha establecido en 1 como referencia). Las altas pendientes alrededor del borde más alejado del cuenco rojo influyen fuertemente en las pendientes medias a medida que p varía: observe cuán grandes se vuelven una vez que p excede 1. El borde horizontal en la tercera superficie (verde dorado) causa la media armónica (p = - 1) ser cero.
Cabe destacar que las posiciones relativas de las tres curvas cambian en p = 0 (la media geométrica): para p mayor que 0, el tazón rojo tiene pendientes promedio más grandes que el azul, mientras que para p negativo , el tazón rojo tiene un promedio más pequeño pendientes que el azul. Por lo tanto, su elección de p puede alterar incluso la clasificación relativa de las pendientes promedio.
El profundo efecto de la media armónica (p = -1) en la forma amarillo-verde debería darnos una pausa: muestra que cuando hay suficientes pendientes pequeñas en el drenaje, la media armónica puede ser tan pequeña que abruma cualquier influencia de Todas las demás pistas.
En el espíritu de un análisis exploratorio de datos, puede considerar variar p, tal vez dejar que oscile entre 0 y ligeramente mayor que 1 para evitar pesos extremos, y encontrar qué valor crea la mejor relación entre la pendiente media y la variable están modelando (como los umbrales de inicialización del canal). "Mejor" generalmente se entiende en el sentido de "más lineal" o "crear residuos [homoscedásticos] constantes" en un modelo de regresión.
fuente
Llevé a cabo un enfoque empírico para encontrar una respuesta complementaria a la excelente respuesta teórica de whuber. Decidí calcular la pendiente en grados y promediar eso usando un promedio angular . A continuación, calculé las medias aritméticas y armónicas del porcentaje de pendiente. Creé un conjunto de puntos de muestra ubicados aleatoriamente en el área de estudio. Solicité 2000 puntos con una distancia mínima de 100 m, lo que arrojó 1326 puntos. Tomé muestras de los valores de cada ráster de pendiente media en cada punto, y convertí las medias porcentuales a grados usando la fórmula
Degrees = atan(percent/100)
. Mi suposición aquí es que la media angular producirá la pendiente media "correcta" en grados, y cualquiera que sea la media porcentual más cercana sería el procedimiento correcto.Luego, comparé todos los valores distintos de cero usando una prueba de Kruskal-Wallace (los supuestos son que para la mayoría de los valores de pendiente cero, sería cero en los tres, y que los valores cero enmascararían las diferencias entre los métodos). Encontré una diferencia significativa entre los tres (chi-cuadrado = 17.9570, DF = 2, p = 0.0001), así que examiné los datos usando el procedimiento de Dunn usando alfa = 0.05 (Elliot y Hynan 2011) . El resultado final es que la media aritmética y armónica son significativamente diferentes entre sí, pero más cerca es significativamente diferente de la media angular:
Si mis suposiciones eran correctas (es muy posible que no lo sean), esto significa que si bien los medios armónicos y aritméticos crean valores diferentes entre sí, ambos están "muy cerca" de la media angular para ser aceptables. Hay otras dos advertencias aquí en las que puedo pensar (por favor agregue cualquier otra si piensa en ellas):
fuente
Dado el supuesto de que no se conocen parámetros que definan la pendiente, cualquier estadístico diría utilizar la pendiente que minimiza las desviaciones RMS de los datos de la misma. (Por supuesto, los ejemplos de Whuber no califican ya que ha elegido formas terrestres generadas matemáticamente, pero para formas terrestres reales la suposición de parámetros no conocidos debería ser válida).
fuente