Parámetro de no centralidad: ¿qué es, qué hace, cuál sería un valor sugerido?

9

He estado tratando de repasar mi conocimiento de estadísticas, especialmente en relación con la determinación del tamaño de la muestra y el análisis estadístico de poder. Pero parece que cuanto más leo, más necesito leer.

De todos modos, encontré una herramienta llamada G * Power que parece hacer todo lo que necesito, pero tengo un problema para comprender el parámetro de no centralidad, ¿qué es, qué hace, cuál sería un valor sugerido, etc.?

La información en wikipedia, etc. está incompleta o no estoy haciendo un buen trabajo para entenderla.

Estoy llevando a cabo una serie de dos pruebas z de cola si eso es de alguna ayuda.

ps ¿Alguien puede agregar mejores etiquetas a esta pregunta?

Final profundo
fuente

Respuestas:

6

En los cálculos de potencia, calibramos las pruebas utilizando el conocimiento de cuál sería la distribución de muestreo del estadístico de prueba bajo la hipótesis nula. Por lo general, sigue una o normal. Esto le permite calcular "valores críticos" para los cuales, los valores que exceden esto se consideran demasiado inconsistentes con lo que se esperaría si el valor nulo fuera verdadero.χ2

El poder de una prueba estadística se calcula especificando el modelo de probabilidad para el proceso de generación de datos bajo una hipótesis alternativa, y calculando la distribución de muestreo para la misma estadística de prueba. Esto ahora toma una distribución diferente.

Para las estadísticas de prueba que tienen una debajo de la nula, toman una distribución no central de bajo la alternativa que cree. Estas son distribuciones muy complicadas, pero el software estándar puede calcular la densidad, la distribución y los cuantiles fácilmente. El truco es que son una convolución de densidades estándar y densidades de Poisson. En R, el , y todas las funciones opcionales tienen un argumento que es, por defecto, 0.χ2χ2χ2dchisqpchisqrchisqncp

Si el estadístico de prueba tiene una distribución normal estándar bajo la hipótesis nula, tendrá una distribución normal media diferente de cero bajo la alternativa. Aquí esa media es el parámetro de no centralidad. Para una prueba t bajo un supuesto de varianza igual, la media viene dada por:

δ=μ1μ2σpooled/n

ingrese la descripción de la imagen aquí

En cualquier caso, los datos generados de acuerdo con una hipótesis alternativa tendrán estadísticas de prueba siguiendo alguna distribución no central con parámetro de no centralidad ( ). El es una función a veces desconocida, a menudo complicada, de los otros parámetros de generación de datos.δδ

AdamO
fuente
Entiendo por qué el muestreo aleatorio conduciría a una media normalmente distribuida si la hipótesis nula fuera cierta (su línea negra). Pero la web me ha dado descripciones contradictorias de la distribución bajo la alternativa (es decir, cuando se supone que es diferente a ); en la suya también es normal (línea roja) pero , por ejemplo, real-statistics.com ha mostrado debe estar sesgada (ver imagen a mitad de la página). Seguramente, me he perdido un truco. ¿Me pueden ayudar a aclarar las cosas? μ2μ1
Ben