¿Cuál es la distribución del error en torno a los datos de crecimiento logístico?

10

En ecología, a menudo usamos la ecuación de crecimiento logístico:

Nt=KN0ertK+N0ert1

o

Nt=KN0N0+(KN0)ert

donde es la capacidad de carga (densidad máxima alcanzada), N 0 es la densidad inicial, r es la tasa de crecimiento, t es el tiempo desde la inicial.KN0rt

El valor de tiene un límite superior suave ( K ) y un límite inferior ( N 0 ) , con un límite inferior fuerte en 0 .Nt(K)(N0)0

Además, en mi contexto específico, las mediciones de se realizan utilizando densidad o de fluorescencia óptica, ambos de los cuales tiene un máximo teórico, y por lo tanto una fuerte superior obligados.Nt

El error alrededor de probablemente se describe mejor por una distribución acotada.Nt

A valores pequeños de , la distribución probablemente tenga un fuerte sesgo positivo, mientras que a valores de N t cercanos a K, la distribución probablemente tenga un fuerte sesgo negativo. Por lo tanto, la distribución probablemente tiene un parámetro de forma que se puede vincular a N t .NtNtNt

La varianza también puede aumentar con .Nt

Aquí hay un ejemplo gráfico

ingrese la descripción de la imagen aquí

con

K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1

que se puede producir en r con

library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")
  • ¿Cuál sería la distribución teórica de errores en torno a (teniendo en cuenta tanto el modelo como la información empírica proporcionada)?Nt

  • NtNt

  • R

Direcciones exploradas hasta ahora:

  • NtK
  • Nt/max
  • Nt/max
Etienne Low-Décarie
fuente
1
KrNtt
@whuber, intenté abordar algunos de tus comentarios en una edición reciente.
Etienne Low-Décarie
1
5 piense que si puede caracterizar las propiedades de la distribución de ruido de la manera en que lo hizo, puede elegir una forma paramétrica con esas propiedades. Creo que para resumir, la familia debe 1. definirse en un intervalo finito, 2. permitir sesgo izquierdo, sesgo derecho y simetría. y 3. tiene una varianza que aumenta a medida que Nt aumenta. La distribución beta se ajusta a la factura para 1 y 2. El intervalo fijo es [0, 1]. Entonces, para permitir que la varianza aumente, podríamos agregar un parámetro c que distribuya la distribución a la intervsl [0, c].
Michael R. Chernick

Respuestas:

3

Como señaló Michael Chernick, la distribución beta escalada tiene el mejor sentido para esto. Sin embargo, a todos los efectos prácticos, y esperando que lo haga NUNCAPara obtener el modelo perfectamente correcto, sería mejor modelar la media a través de una regresión no lineal de acuerdo con su ecuación de crecimiento logístico y concluir esto con errores estándar que sean robustos a la heterocedasticidad. Poner esto en un contexto de máxima probabilidad creará una falsa sensación de gran precisión. Si la teoría ecológica produjera una distribución, debería ajustarse a esa distribución. Si su teoría solo produce la predicción para la media, debe apegarse a esta interpretación y no tratar de llegar a nada más que eso, como una distribución completa. (El sistema de curvas de Pearson seguramente era elegante hace 100 años, pero los procesos aleatorios no siguen ecuaciones diferenciales para producir las curvas de densidad, que fue su motivación con estas curvas de densidad, más bien,Ntdebe tener un límite superior; Prefiero decir que el error de medición introducido por sus dispositivos se vuelve crítico a medida que el proceso alcanza ese límite superior de medición razonablemente precisa. Si confunde la medición con el proceso subyacente, debe reconocerlo explícitamente, pero me imagino que tiene un mayor interés en el proceso que en describir cómo funciona su dispositivo. (El proceso estará allí dentro de 10 años; nuevos dispositivos de medición pueden estar disponibles, por lo que su trabajo quedará obsoleto).

StasK
fuente
¡Gracias un montón! Estoy de acuerdo en que una separación de proceso y medida es interesante. Sin embargo, sugeriría que la mayoría de los métodos de medición tienen este límite superior fuerte, pero podría ser importante aislar esto. Si uso la versión beta escalada, a pesar de su advertencia sobre la confianza de ajuste de MLE, ¿alguna sugerencia sobre cómo relacionar los parámetros de forma con este sistema para modelar variables para permitir MLE?
Etienne Low-Décarie
Si está convencido de que sus límites son realmente importantes en su aplicación, puede apegarse a esta versión beta escalada. Todo lo que digo es que no estoy convencido. Existen modelos para datos truncados, donde todo lo que sabe es que el valor real excede el máximo que puede medir; a veces se usan junto con la codificación superior de ingresos, mientras que por razones de confidencialidad los ingresos superiores a USD 100K / año se truncan a USD 100K / año.
StasK
1

@whuber tiene razón en que no existe una relación necesaria de la parte estructural de este modelo con la distribución de los términos de error. Por lo tanto, no hay respuesta a su pregunta para la distribución teórica de errores.

Sin embargo, esto no significa que no sea una buena pregunta, solo que la respuesta tendrá que ser en gran medida empírica.

Parece estar asumiendo que la aleatoriedad es aditiva. No veo ninguna razón (aparte de la conveniencia computacional) para que este sea el caso. ¿Es una alternativa que haya un elemento aleatorio en otro lugar del modelo? Por ejemplo, vea lo siguiente, donde la aleatoriedad se introduce como Distribuida normalmente con una media de 1, la varianza es lo único que se puede estimar. No tengo ninguna razón para pensar que esto sea lo correcto, aparte de que produce resultados plausibles que parecen coincidir con lo que quieres ver. No sé si sería práctico usar algo como esto como base para estimar un modelo.

loggrowth <- function(K, N, r, time, rand=1){
    K*N*exp(rand*r*time)/(K+N*exp(rand*r*time-1)))}

plot(1:100, loggrowth(100,20,.08,1:100, rnorm(100,1,0.1)), 
    type="p", ylab="", xlab="time")
lines(1:100, loggrowth(100,20,.08,1:100))

ingrese la descripción de la imagen aquí

Peter Ellis
fuente
En este caso, podría tener valores de Nt por debajo de cero y por encima del límite superior duro. Además, se espera ruido en todos los parámetros (no necesariamente en el producto de un parámetro con el tiempo), de ahí el ruido en la variable de respuesta. Todavía estaría interesado en la interpretación de máxima probabilidad de su enfoque.
Etienne Low-Décarie
Esto no permite que la distribución esté limitada por cada Nt y no permite que el componente de ruido esté sesgado. No sé si mi idea de una distribución beta escalada se ha utilizado en la literatura, pero satisface bien las restricciones. No lo he probado, pero tal vez se pueda intentar la máxima probabilidad. No estoy seguro, pero tal vez habría un problema si se incluye c en la estimación de probabilidad. Quizás c podría estimarse por separado basándose solo en Nt y luego el resto del modelo podría ajustarse según la máxima probabilidad para cada Nt fijo.
Michael R. Chernick
Solo estoy pensando en voz alta. ¿Alguien piensa que este problema podría convertirse en un buen trabajo de investigación?
Michael R. Chernick
Un artículo de 1966 examinó esto un poco, sin embargo, no he visto uno más reciente. ¿Tal vez las cosas han cambiado desde entonces? jstor.org/discover/10.2307/…
Etienne Low-Décarie
Avíseme si decide seguir esta ruta.
Etienne Low-Décarie