¿Cómo medir / argumentar la bondad de ajuste de una línea de tendencia a una ley de poder?

21

Tengo algunos datos a los que estoy tratando de ajustar una línea de tendencia. Creo que los datos siguen una ley de potencia, por lo que he trazado los datos en ejes de registro-registro buscando una línea recta. Esto ha resultado en una línea (casi) recta y, por lo tanto, en Excel he agregado una línea de tendencia para una ley de potencia. Siendo una estadística nuevab, mi pregunta es, ¿cuál es ahora la mejor manera de pasar de "bueno, parece que la línea se ajusta bastante bien" a "la propiedad numérica demuestra que este gráfico se ajusta adecuadamente a una ley de potencia"? X

En Excel puedo obtener un valor de r cuadrado, aunque dado mi conocimiento limitado de estadísticas, ni siquiera sé si esto es realmente apropiado en mis circunstancias específicas. He incluido una imagen a continuación que muestra la gráfica de los datos con los que estoy trabajando en Excel. Tengo un poco de experiencia con R, así que si mi análisis está limitado por mis herramientas, estoy abierto a sugerencias sobre cómo mejorarlo con R.

texto alternativo

Bryce Thomas
fuente

Respuestas:

24

Ver la página de Aaron Clauset:

que tiene enlaces al código para ajustar las leyes de potencia (Matlab, R, Python, C ++), así como un documento de Clauset y Shalizi que debería leer primero.

Es posible que desee leer primero las publicaciones de blogs de Clauset y Shalizi en el periódico:

Un resumen del último enlace podría ser:

  • Muchas distribuciones le dan líneas rectas en un diagrama de registro.

  • Abusar de la regresión lineal hace llorar al bebé Gauss.
    Ajustar una línea a su diagrama de log-log por mínimos cuadrados es una mala idea.

  • Use la máxima probabilidad para estimar el exponente de escala.
  • Utilice la bondad de ajuste para estimar dónde comienza la región de escala.
  • Use una prueba de bondad de ajuste para verificar la bondad de ajuste.
  • Use la prueba de Vuong para verificar alternativas y prepárese para la decepción.
ars
fuente
1
Secundo esto. Hay muchos ejemplos de algo que parecía una ley de poder, pero cuando se examinó un poco más rigurosamente resultó no ser ... y no, el alto R ^ 2 en la tabla no es suficiente.
PeterR
"Así que piensas ..." es una excelente referencia. Los puntos 1-6 (de 7) abordan directamente la pregunta planteada aquí.
whuber
Pero una distribución de la ley de poder no es lo mismo que ajustar una relación de ley de poder entre dos variables separadas. Asumí que la pregunta era sobre esto último, aunque no estoy seguro.
onestop
χ2
2
@JM: en realidad no, el chi-cuadrado es sensible al binning y las fluctuaciones de la cola complican eso. Creo que incluso con el KS, vuelven a pesar la estadística para los puntos extremos, y hay una discusión sobre otras pruebas. @onestop: asumí lo contrario, y en la relectura, podrías estar en lo cierto. No estoy realmente seguro ..
ars
3

Si está interesado en las funciones bivariadas de la ley de poder (a diferencia de las distribuciones univariadas de la ley de poder), entonces

Warton y col. " Métodos de ajuste de línea bivariados para alometría ". Biol. Rev. 81, 259-201 (2006)

Es una excelente referencia. En este caso, la regresión es lo correcto, aunque puede haber algunas correcciones (OLS vs. RMA, etc.) dependiendo de lo que quiera que signifiquen los resultados de la regresión.


fuente
Aaron: ese enlace está muerto, ¿podrías publicar uno nuevo?
keflavich
Gracias por esto. La mayoría de la información es para distribuciones univariadas que tienden a enterrar información sobre relaciones bivariadas ... Aquí hay un enlace a la lista de Riley onlinelibrary.wiley.com/doi/abs/10.1017/S1464793106007007
songololo