¿Por qué este extracto dice que la estimación imparcial de la desviación estándar generalmente no es relevante?

14

Estaba leyendo sobre el cálculo de la estimación imparcial de la desviación estándar y la fuente que leí decía

(...) excepto en algunas situaciones importantes, la tarea tiene poca relevancia para las aplicaciones de estadísticas, ya que su necesidad se evita mediante procedimientos estándar, como el uso de pruebas de significación e intervalos de confianza, o mediante el uso del análisis bayesiano.

Me preguntaba si alguien podría dilucidar el razonamiento detrás de esta declaración, por ejemplo, ¿el intervalo de confianza no utiliza la desviación estándar como parte del cálculo? Por lo tanto, ¿no se verían afectados los intervalos de confianza por una desviación estándar sesgada?

EDITAR:

Gracias por las respuestas hasta ahora, pero no estoy muy seguro de seguir algunas de las razones para ellas, así que agregaré un ejemplo muy simple. El punto es que si la fuente es correcta, entonces algo está mal desde mi conclusión hasta el ejemplo y me gustaría que alguien señale cómo el valor p no depende de la desviación estándar.

Suponga que un investigador desea evaluar si el puntaje promedio de los estudiantes de quinto grado en un examen en su ciudad difiere del promedio nacional de 76 con un nivel de significancia de 0.05. El investigador muestreó al azar los puntajes de 20 estudiantes. La media muestral fue 80.85 con una desviación estándar muestral de 8.87. Esto significa: t = (80.85-76) / (8.87 / sqrt (20)) = 2.44. Luego se usa una tabla t para calcular que el valor de probabilidad de dos colas en at de 2.44 con 19 df es 0.025. Esto está por debajo de nuestro nivel de significancia de 0.05, por lo que rechazamos la hipótesis nula.

Entonces, en este ejemplo, ¿no cambiaría el valor p (y tal vez su conclusión) dependiendo de cómo calculó su desviación estándar de la muestra?

BYS2
fuente
2
Esto parece extraño, por la razón que das. ¿Quizás podría darnos el párrafo anterior también en caso de que nos falte algo? Una cosa que hace que el sesgo no sea un gran problema es que se vuelve bastante poco importante a medida que el tamaño de la muestra aumenta, y probablemente no sea material en comparación con todos los otros problemas, por ejemplo, la especificación errónea del modelo que normalmente tenemos, pero esta no es la razón dado en su fuente.
Peter Ellis
1
@PeterEllis, esto es en realidad de la página de Wikipedia sobre "estimación imparcial de la desviación estándar" ( en.wikipedia.org/wiki/Unlimited_estimation_of_standard_deviation ).
BYS2

Respuestas:

17

Estoy de acuerdo con Glen_b en esto. Tal vez pueda agregar algunas palabras para que el punto sea aún más claro. Si los datos provienen de una distribución normal (situación iid) con una varianza desconocida, el estadístico t es la cantidad fundamental utilizada para generar intervalos de confianza y hacer pruebas de hipótesis. Lo único que importa para esa inferencia es su distribución bajo la hipótesis nula (para determinar el valor crítico) y bajo la alternativa (para determinar la potencia y la muestra). Esas son las distribuciones t centrales y no centrales, respectivamente. Considerando ahora por un momento el problema de una muestra, la prueba t incluso tiene propiedades óptimas como prueba para la media de una distribución normal. Ahora la varianza de la muestra es un estimador imparcial de la varianza de la población, pero su raíz cuadrada es un estimador BIASED de la desviación estándar de la población. No lo hace No importa que este estimador BIASED entre en el denominador de la cantidad pivotal. Ahora sí juega un papel en que es un estimador consistente. Eso es lo que permite que la distribución t se acerque a la normal estándar a medida que el tamaño de la muestra llega al infinito. Pero ser parcial para cualquier fijo no afecta las buenas propiedades de la prueba.n

En mi opinión, la imparcialidad se enfatiza demasiado en las clases introductorias de estadística. La precisión y consistencia de los estimadores son las propiedades reales que merecen énfasis.

Para otros problemas donde se aplican métodos paramétricos o no paramétricos, una estimación de la desviación estándar ni siquiera entra en la fórmula.

Michael R. Chernick
fuente
77
Depende de la estimación, pero solo hay una estimación para la que se aplica la t con 19 grados de libertad y esa estimación es la raíz cuadrada de la estimación habitual de la varianza de la muestra. Si usa una estimación diferente de la desviación estándar, tiene una distribución de referencia diferente para el estadístico de prueba bajo la hipótesis nula. No es el t.
Michael R. Chernick
2
@ BYS2: Tenga en cuenta que, en términos del intervalo construido en el ejemplo que proporciona, nada cambia multiplicando la desviación estándar de la muestra por un factor de escala (por ejemplo, para que sea imparcial). La distribución del estadístico de prueba cambiaría (ligeramente) en este caso, ¡pero el CI construido terminaría siendo exactamente el mismo! Ahora, si hiciste alguna "corrección" que dependía de los datos mismos, eso produciría algo diferente (en general). Vea mi comentario bajo la respuesta de Glen.
cardenal
44
@ BYS2: en el caso del modelo normal que utiliza la estadística , existe una buena correspondencia entre los CI y el valor p . Por lo tanto, el valor p no cambiará si "reescala" la desviación estándar de la muestra por una constante conocida. Por ejemplo: Let ~ T b = ( ˉ X - μ ) / ( b sigma ) = T / b para fijo b > 0 . Entonces, P ( ˜ T b > u ) = P (tppT~b=(X¯μ)/(bσ^)=T/bb>0 y, por lo tanto, el valor crítico ˜ t b , α = b t α , es decir, existe una correspondencia uno a uno entre ellos. ¿Tiene sentido?
P(T~b>u)=P(T>bu)
t~b,α=btα
cardenal
1
No, lo que Cardinal señala correctamente es que es posible multiplicar el estadístico t por una constante para usar esencialmente una estimación diferente de la desviación estándar. La estadística de prueba ya no tiene la distribución t. Es una distribución ligeramente diferente debido a la constante. La media cambia por un factor de b y también la desviación estándar. Cuando se trata de calcular el valor crítico para la estadística de prueba, cambia apropiadamente como lo demuestra arriba.
Michael R. Chernick
1
@ BYS2 Sí, eso es correcto.
Michael R. Chernick
5

Considere un intervalo calculado sobre la base de una cantidad fundamental, como una estadística t. El valor medio del estimador para la desviación estándar realmente no entra en él: el intervalo se basa en la distribución de la estadística. Entonces, la afirmación es correcta en lo que respecta a eso.

Glen_b -Reinstate a Monica
fuente
1
Sí, pero la distribución de la estadística no se basa en su desviación estándar, que es desconocida en la mayoría de los casos, por lo que debe usar un estimador.
BYS2
44
(+1) Glen. Para @ BYS2: Hay un par de puntos clave aquí. Primero, si tenemos a mano una cantidad fundamental, proporciona un medio muy conveniente para construir conjuntos de confianza, pero a menudo no existen. El objetivo de una cantidad fundamental es que la distribución depende exclusivamente de cantidades conocidas . En segundo lugar, la cantidad fundamental está íntimamente ligada al modelo subyacente. Si los datos se desvían del modelo asumido, entonces la distribución del estadístico de prueba también puede y su caracterización como una cantidad fundamental puede no ser tan relevante. :)
cardenal
4

La interpretación es siempre una especulación parcial, pero creo que el significado implícito es que a menudo puede obtener el resultado que desea sin estimar explícitamente la desviación estándar. En otras palabras, creo que el autor se refiere a situaciones en las que no usaría una estimación de la desviación estándar, en lugar de una estimación sesgada.

Por ejemplo, si puede construir una estimación de la distribución completa de una estadística, puede calcular los intervalos de confianza sin utilizar la desviación estándar. De hecho, para muchas distribuciones (no normales) la desviación estándar en sí (y la media) no es suficiente para calcular una estimación del intervalo de confianza. En otros casos, como una prueba de signos , tampoco necesita una estimación de la desviación estándar.

(Por supuesto, no es trivial construir una estimación imparcial de una distribución completa, y en las estadísticas bayesianas es bastante común introducir sesgos explícitamente a través de lo anterior).

MLS
fuente
1
Puede ser interesante ampliar un poco más a fondo lo que quiso decir con el último párrafo. Por ejemplo, si puedo tomar muestras de la distribución de la estadística en cuestión, entonces el cdf empírico proporciona un medio muy fácil y simple para generar una estimación imparcial puntual de la función de distribución. :)
cardenal
1
maxiXimaxiXiXi
1
XiimaxiXi
2
Esto es cierto y cercano al punto que estaba tratando de sacar. La primera oración del último párrafo se refiere a la construcción de una estimación imparcial de una función estadística no lineal a partir de, por ejemplo, una muestra aleatoria única. Esto es bastante diferente de construir una estimación imparcial de una distribución completa a partir de una muestra aleatoria de la función misma. :-)
cardenal