Intervalos de confianza transformados hacia atrás

11

Habiendo encontrado esta discusión , estoy planteando la pregunta sobre las convenciones de los intervalos de confianza transformados hacia atrás.

De acuerdo con este artículo, la cobertura nominal transformada por CI para la media de una variable aleatoria logarítmica normal es:

 UCL(X)=exp(Y+var(Y)2+zvar(Y)n+var(Y)22(n1))  LCL(X)=exp(Y+var(Y)2zvar(Y)n+var(Y)22(n1))

/ y no el ingenuo /exp((Y)+zvar(Y))

Ahora, ¿cuáles son estos CI para las siguientes transformaciones:

  1. x 1 / 3x yx1/3
  2. arcsin(x)
  3. log(x1x)
  4. 1/x

¿Qué tal el intervalo de tolerancia para la variable aleatoria misma (me refiero a un solo valor de muestra extraído aleatoriamente de la población)? ¿Existe el mismo problema con los intervalos transformados hacia atrás, o tendrán la cobertura nominal?

Germaniawerks
fuente
1
Vea la expansión de Taylor para momentos de funciones de rvs , y el método Delta . Pero se necesita cuidado. Vea, por ejemplo, la discusión aquí y [aquí] (stats.stackexchange.com/questions/41896/varx-is-known-how-to-calculate-var1-x/). La búsqueda en la serie de Taylor presentará varios ejemplos y debates útiles.
Glen_b -Reinstale a Monica
He hecho ediciones sustanciales a tus fórmulas. Por favor, compruebe que no me equivoqué. En mi comentario anterior (perdón por el enlace formateado incorrectamente allí) - también vea el comentario de precaución bajo la respuesta aquí
Glen_b -Reinstale a Monica
Gracias. Aunque casi no puedo publicar nada sin ser editado con esas expresiones elegantes.
Germaniawerks

Respuestas:

6

¿Por qué estás haciendo transformaciones? Eso es fundamental para responder a su pregunta porque en algunos casos la transformación ingenua es la respuesta correcta. De hecho, creo que argumentaré que, si la ingenua transformación inversa no es la respuesta correcta, entonces no deberías retroceder en absoluto.

El problema general de la transformación de la espalda me parece muy problemático y, a menudo, está lleno de ideas confusas. Mirando el artículo que citó, ¿qué les hace pensar que es una pregunta razonable que el CI transformado no capta la media original? Es una interpretación errónea de los valores transformados hacia atrás. Piensan que la cobertura debería ser para el análisis directo en el espacio transformado posterior. Y luego crean una transformación inversa para corregir ese error en lugar de su interpretación.

Si realiza sus análisis de valores de registro, sus estimaciones e inferencias se aplican a esos valores de registro. Mientras considere cualquier transformación posterior, una representación de cómo se ve ese análisis de registro en el espacio exponencial, y solo así, entonces está bien con el enfoque ingenuo. De hecho, es exacto. Eso es cierto para cualquier transformación.

Hacer lo que están haciendo resuelve el problema de tratar de convertir el CI en algo que no es, un CI de los valores transformados. Esto está lleno de problemas. Considere el vínculo en el que se encuentra ahora, los dos IC posibles, uno en el espacio transformado donde realiza sus análisis y el otro transformado, hacen declaraciones muy diferentes sobre dónde está el mu probable en el otro espacio. La transformación inversa recomendada crea más problemas de los que resuelve.

Lo mejor que se puede sacar de ese documento es que cuando decide transformar los datos, tiene un impacto más profundo de lo esperado en el significado de sus estimaciones e inferencias.

Juan
fuente
¿Podría explicar eso más? Me parece que el problema es que el CI ingenuo da el de la media geométrica, en lugar de la aritmética. Que es lo que implicaría ser estrictamente más pequeño, como dicen, y de ahí la inconsistencia y la mala cobertura.
Germaniawerks
¿Inconsistencia con qué? Si va a analizar su distribución exponencial directamente y desea conocer la media aritmética, entonces sí, es una cobertura deficiente para eso. Pero si quisieras hacer eso, entonces deberías haberlo hecho. Si va a iniciar sesión, transforme su distribución y analice los exponentes, entonces es exactamente la cobertura adecuada para eso.
John
No puedo ver por qué te opones al método en el artículo. Las simulaciones muestran que funciona bien, mientras que el método ingenuo está peor que el "enfoque de límite central".
Germaniawerks
1
Lo muestran mejor para lo que quieren que sea. El método ingenuo funciona bien para lo que es. Mire la simulación en la sección 5. Establecieron una media de distribución de lnorm 5, que tiene un exponente de 148.4. ¡Luego continúan discutiendo la cobertura de la media de 244.6! Eso solo sería importante si va a modelar la media de la distribución original, NO los registros. Están tratando de convertirlo en algo que no es. El cálculo ingenuo tiene una cobertura perfectamente fina sobre la media del registro, 5. Ninguno de los otros IC tiene un IC del 95% de ese valor y ese es el que está analizando.
John