Quiero probar una correlación de muestra para significancia, usando valores p, es decir
He entendido que puedo usar la transformación z de Fisher para calcular esto
y encontrar el valor p por
utilizando la distribución normal estándar.
Mi pregunta es: ¿qué tan grande debería ser para que esta sea una transformación apropiada? Obviamente, debe ser mayor que 3. Mi libro de texto no menciona ninguna restricción, pero en la diapositiva 29 de esta presentación dice que debe ser mayor que 10. Para los datos que consideraré, tendré algo como .
correlation
sample-size
fisher-transform
Gunnhild
fuente
fuente
Respuestas:
Para preguntas como estas, simplemente ejecutaría una simulación y vería si los valores comportan como espero. El valor p es la probabilidad de extraer aleatoriamente una muestra que se desvía al menos tanto de la hipótesis nula como de los datos que observó si la hipótesis nula es verdadera. Entonces, si tuviéramos muchas de esas muestras, y una de ellas tuviera un valor p de .04, entonces esperaríamos que el 4% de esas muestras tuvieran un valor inferior a .04. Lo mismo es cierto para todos los demás valores p posibles .p p p p
A continuación se muestra una simulación en Stata. Los gráficos verifican si los valores miden lo que se supone que miden, es decir, muestran cuánto se desvía la proporción de muestras con valores p inferiores al valor p nominal del valor p nominal . Como puede ver, esa prueba es algo problemática con un número tan pequeño de observaciones. Si es o no demasiado problemático para su investigación es su decisión.p p p p
fuente
FWIW Veo la recomendación en Myers & Well (diseño de investigación y análisis estadísticos, segunda edición, 2003, p. 492). La nota al pie dice:N≥10
fuente
No estoy seguro si una transformación de Fisher es apropiada aquí. Para H 0 : ρ = 0 (NB: la hipótesis nula es para la población ρ , no la muestra r ), la distribución de muestreo del coeficiente de correlación ya es simétrica, por lo que no es necesario reducir la asimetría, que es lo que pretende hacer z de Fisher , y puedes usar la aproximación t de Student .z H0:ρ=0 ρ r z t
Suponiendo que quiere decir , entonces la asimetría de ese PDF dependerá del valor propuesto de ρ 0 , por lo que no habría una respuesta general de cuán grande debería ser n . Además, los valores mínimos de n dependerán del nivel de significancia α hacia el que esté trabajando. No mencionaste su valor.H0:ρ=ρ0≠0 ρ0 n n α
El punto de Nick es justo: las aproximaciones y recomendaciones siempre están operando en alguna área gris.
fuente