Tengo curiosidad acerca de una afirmación hecha en el artículo de Wikipedia sobre el tamaño del efecto . Específicamente:
[...] una comparación estadística no nula siempre mostrará resultados estadísticamente significativos a menos que el tamaño del efecto de la población sea exactamente cero
No estoy seguro de lo que esto significa / implica, y mucho menos un argumento para respaldarlo. Supongo que, después de todo, un efecto es una estadística, es decir, un valor calculado a partir de una muestra, con su propia distribución. ¿Significa esto que los efectos nunca se deben a una variación aleatoria (que es lo que entiendo que significa que no sea significativo)? ¿Entonces consideramos si el efecto es lo suficientemente fuerte, teniendo un valor absoluto alto?
Estoy considerando el efecto con el que estoy más familiarizado: el coeficiente de correlación de Pearson r parece contradecir esto. ¿Por qué cualquier sería estadísticamente significativo? Si es pequeña, nuestra línea de regresión
Para pequeño, está cerca de 0, una prueba F probablemente contendrá un intervalo de confianza que contiene 0 para la pendiente. ¿No es este un contraejemplo?
fuente
Respuestas:
Como un simple ejemplo, suponga que estoy estimando su altura utilizando algunos mumbo jumbo estadísticos.
Siempre ha dicho a los demás que mide 177 cm (aproximadamente 5 pies 10 pulgadas).
Si tuviera que probar esta hipótesis (que su altura es igual a 177 cm, ), y podría reducir el error de medición en mi lo suficiente, entonces podría demostrar que es no , de hecho, 177 cm de altura. Eventualmente, si calculo su altura a suficientes decimales, seguramente se desviará de la altura establecida de 177.00000000 cm. Quizás eres 177.02 cm; Solo tengo que reducir mi error a menos de .02 para descubrir que no mides 177 cm.h = 177
¿Cómo reduzco el error en las estadísticas? Obtenga una muestra más grande. Si obtiene una muestra lo suficientemente grande, el error se vuelve tan pequeño que puede detectar las desviaciones más minúsculas de la hipótesis nula.
fuente
Como señala @Kodiologist, esto realmente se trata de lo que sucede con muestras de gran tamaño. Para tamaños de muestra pequeños no hay razón por la que no pueda tener falsos positivos o falsos negativos.
Creo que la prueba hace que el caso asintótico sea más claro. Supongamos que tenemos X 1 , ... , X n iid ∼ N ( μ , 1 ) y queremos probar H 0 : μ = 0 vs H A : μ ≠ 0 . Nuestra estadística de prueba es Z n = ˉ X n - 0z X1,…,Xnorte∼iidN(μ,1) H0:μ=0 HA:μ≠0
entoncesZn=√X¯n∼N( μ ,1norte) . Estamos interesados enP(|Zn|≥α).
P(|Zn|≥α)=P(Zn≤-α)+P(Zn≥α)=1+Φ(-α-μ √Znorte= n--√X¯norte∼ N( μ n--√,1) P(|Zn|≥α)
fuente
Podría decirse que lo que dijeron es incorrecto, si no por otra razón que su uso de "esto siempre sucede".
No sé si este es el quid de la confusión que estás teniendo, pero lo publicaré porque creo que muchos lo hacen y se confundirán con esto:
Lo que literalmente dicen se traduce en lo siguiente:
Sin embargo, lo que intentaban decir es lo siguiente:
Aquí hay diferencias cruciales:
No hay garantía. Es más probable que obtenga un resultado significativo con una muestra más grande. Ahora, podrían esquivar parte de la culpa aquí, porque hasta ahora es solo un problema de terminología. En un contexto probabilístico, que se entiende que la declaración "si n es suficientemente grande, entonces X" puede también ser interpretado en el sentido de "X vuelve cada vez más probable que sea cierto a medida que n aumenta de tamaño" .
Sin embargo, esta interpretación sale por mi ventana tan pronto como dicen que esto "siempre" sucede. La terminología adecuada aquí habría sido decir que esto sucede " con alta probabilidad " 1 .
Pero una vez que entiendes la literatura, entiendes lo que están tratando de decir.
(Nota al margen: por cierto, este es exactamente uno de los problemas constantes que muchas personas tienen con Wikipedia. Con frecuencia, solo es posible entender lo que dicen si ya conoce el material, por lo que solo sirve como referencia o como recordatorio , no como material de autoaprendizaje).
1 Para los compañeros pedantes (¡hola!), Sí, el término tiene un significado más específico que el que he vinculado. El término técnico más flexible que probablemente deseamos aquí es "asintóticamente casi seguro" . Vea aquí .
fuente
Mi ejemplo favorito es el número de dedos por género. La gran mayoría de las personas tiene 10 dedos. Algunos han perdido los dedos debido a accidentes. Algunos tienen dedos extra.
No sé si los hombres tienen más dedos que las mujeres (en promedio). Toda la evidencia fácilmente disponible sugiere que los hombres y las mujeres tienen 10 dedos.
Sin embargo, estoy muy seguro de que si hiciera un censo de todos los hombres y todas las mujeres, aprendería que un género tiene más dedos (en promedio) que el otro.
fuente