Estaba leyendo sobre el cálculo de la estimación imparcial de la desviación estándar y la fuente que leí decía
(...) excepto en algunas situaciones importantes, la tarea tiene poca relevancia para las aplicaciones de estadísticas, ya que su necesidad se evita mediante procedimientos estándar, como el uso de pruebas de significación e intervalos de confianza, o mediante el uso del análisis bayesiano.
Me preguntaba si alguien podría dilucidar el razonamiento detrás de esta declaración, por ejemplo, ¿el intervalo de confianza no utiliza la desviación estándar como parte del cálculo? Por lo tanto, ¿no se verían afectados los intervalos de confianza por una desviación estándar sesgada?
EDITAR:
Gracias por las respuestas hasta ahora, pero no estoy muy seguro de seguir algunas de las razones para ellas, así que agregaré un ejemplo muy simple. El punto es que si la fuente es correcta, entonces algo está mal desde mi conclusión hasta el ejemplo y me gustaría que alguien señale cómo el valor p no depende de la desviación estándar.
Suponga que un investigador desea evaluar si el puntaje promedio de los estudiantes de quinto grado en un examen en su ciudad difiere del promedio nacional de 76 con un nivel de significancia de 0.05. El investigador muestreó al azar los puntajes de 20 estudiantes. La media muestral fue 80.85 con una desviación estándar muestral de 8.87. Esto significa: t = (80.85-76) / (8.87 / sqrt (20)) = 2.44. Luego se usa una tabla t para calcular que el valor de probabilidad de dos colas en at de 2.44 con 19 df es 0.025. Esto está por debajo de nuestro nivel de significancia de 0.05, por lo que rechazamos la hipótesis nula.
Entonces, en este ejemplo, ¿no cambiaría el valor p (y tal vez su conclusión) dependiendo de cómo calculó su desviación estándar de la muestra?
Respuestas:
Estoy de acuerdo con Glen_b en esto. Tal vez pueda agregar algunas palabras para que el punto sea aún más claro. Si los datos provienen de una distribución normal (situación iid) con una varianza desconocida, el estadístico t es la cantidad fundamental utilizada para generar intervalos de confianza y hacer pruebas de hipótesis. Lo único que importa para esa inferencia es su distribución bajo la hipótesis nula (para determinar el valor crítico) y bajo la alternativa (para determinar la potencia y la muestra). Esas son las distribuciones t centrales y no centrales, respectivamente. Considerando ahora por un momento el problema de una muestra, la prueba t incluso tiene propiedades óptimas como prueba para la media de una distribución normal. Ahora la varianza de la muestra es un estimador imparcial de la varianza de la población, pero su raíz cuadrada es un estimador BIASED de la desviación estándar de la población. No lo hace No importa que este estimador BIASED entre en el denominador de la cantidad pivotal. Ahora sí juega un papel en que es un estimador consistente. Eso es lo que permite que la distribución t se acerque a la normal estándar a medida que el tamaño de la muestra llega al infinito. Pero ser parcial para cualquier fijo no afecta las buenas propiedades de la prueba.n
En mi opinión, la imparcialidad se enfatiza demasiado en las clases introductorias de estadística. La precisión y consistencia de los estimadores son las propiedades reales que merecen énfasis.
Para otros problemas donde se aplican métodos paramétricos o no paramétricos, una estimación de la desviación estándar ni siquiera entra en la fórmula.
fuente
Considere un intervalo calculado sobre la base de una cantidad fundamental, como una estadística t. El valor medio del estimador para la desviación estándar realmente no entra en él: el intervalo se basa en la distribución de la estadística. Entonces, la afirmación es correcta en lo que respecta a eso.
fuente
La interpretación es siempre una especulación parcial, pero creo que el significado implícito es que a menudo puede obtener el resultado que desea sin estimar explícitamente la desviación estándar. En otras palabras, creo que el autor se refiere a situaciones en las que no usaría una estimación de la desviación estándar, en lugar de una estimación sesgada.
Por ejemplo, si puede construir una estimación de la distribución completa de una estadística, puede calcular los intervalos de confianza sin utilizar la desviación estándar. De hecho, para muchas distribuciones (no normales) la desviación estándar en sí (y la media) no es suficiente para calcular una estimación del intervalo de confianza. En otros casos, como una prueba de signos , tampoco necesita una estimación de la desviación estándar.
(Por supuesto, no es trivial construir una estimación imparcial de una distribución completa, y en las estadísticas bayesianas es bastante común introducir sesgos explícitamente a través de lo anterior).
fuente