Comparando AIC de un modelo y su versión transformada

17

La esencia de mi pregunta es esta:

Sea una variable aleatoria normal multivariante con media μ y matriz de covarianza Σ . Sea Z : = log ( Y ) , es decir, Z i = log ( Y i ) , i { 1 , ... , n } . ¿Cómo comparo el AIC de un modelo ajustado a las realizaciones observadas de Y versus un modelo ajustado a las realizaciones observadas de Z ?YRnμΣZ:=log(Y)Zi=log(Yi),i{1,,n}YZ



Mi pregunta inicial y un poco más larga:

Dejar una variable aleatoria normal multivariante. Si quiero comparar un ajuste del modelo a Y versus un ajuste del modelo para registrar ( Y ) , podría ver sus probabilidades de registro. Sin embargo, dado que estos modelos no están anidados, no puedo comparar las probabilidades de registro (y cosas como AIC, etc.) directamente, pero tengo que transformarlas.YN(μ,Σ)Ylog(Y)

Sé que si son variables aleatorias con pdf conjunto g ( x 1 , ... , x n ) y si Y i = t i ( X 1 , ... , X n ) para transformaciones uno a uno t Y n viene dada por f ( y 1 , , y n ) = g ( t -X1,,Xng(x1,,xn)Yi=ti(X1,,Xn) e i { 1 , ... , n } , luego el pdf de Y 1 , ... ,tii{1,,n}Y1,,YndondeJes el jacobiano asociado con la transformación.

f(y1,,yn)=g(t11(y),,tn1(y))det(J)
J

¿Simplemente tengo que usar la regla de transformación para comparar

a l ( log ( Y ) ) = log ( n i = 1 ϕ ( log ( y i ) ; μ , Σ ) )

l(Y)=log(i=1nϕ(yi;μ,Σ))
l(log(Y))=log(i=1nϕ(log(yi);μ,Σ))

¿O hay algo más que pueda hacer?


[editar] Olvidé colocar logaritmos en las dos últimas expresiones.

Stijn
fuente
También parece haber perdido al jacobiano en la última expresión.
whuber
2
No entiendo la transformación del . ¿Cómo puedes tomar log Y cuando Y es negativo? loglogYY
semibruin

Respuestas:

6

No puede comparar el AIC o BIC cuando se ajusta a dos conjuntos de datos diferentes, es decir, Y y . Solo puede comparar dos modelos basados ​​en AIC o BIC solo cuando se ajusta al mismo conjunto de datos. Eche un vistazo a la selección de modelos y la inferencia multimodelo: un enfoque práctico teórico de la información (Burnham y Anderson, 2004). Mencionaron mi respuesta en la página 81 (sección 2.11.3 Transformaciones de la variable de respuesta):Z

Los investigadores deben asegurarse de que todas las hipótesis se modelen utilizando la misma variable de respuesta (por ejemplo, si todo el conjunto de modelos se basara en log (y), no se crearía ningún problema; es la combinación de variables de respuesta lo que es incorrecto).

Y, por cierto, para usar los criterios AIC o BIC, sus modelos no necesitan estar necesariamente anidados (misma referencia, página 88, sección 2.12.4 Modelos no anidados), y en realidad esa es una de las ventajas de usar BIC.

Stat
fuente
5

log{y(n)+1}log{y(n)+1}n=1,2,...,N

Akaike, H. 1978. "Sobre la probabilidad de un modelo de serie temporal", Journal of the Royal Statistical Society, Serie D (The Statistician), 27 (3/4), págs. 217–235.

Gord B
fuente
1
¿Hay algún enfoque en R para hacer esto?
theforestecologist