Podemos usar la estadística F para determinar si al menos uno de los predictores tiene un efecto en la respuesta. Pero, ¿por qué no tomar un valor p mínimo en todos los predictores? No requiere la introducción de un nuevo concepto.
f-statistic
Yurii
fuente
fuente
Respuestas:
Aquí supongo que tiene la intención de comparar alguna prueba basada en el valor p mínimo con una prueba F general.
Al elegir el valor p más pequeño y compararlo con un nivel de significancia particular , su valor p ya no tiene el mismo significado que tendría para una sola prueba. En efecto, está probando todas las variables individuales (y si alguna conduce al rechazo, concluye que al menos uno de los predictores tiene un efecto en la respuesta). La tasa de error general tipo I es mucho más alta que una sola prueba. (El problema de las pruebas múltiples ).α
Si reduce su nivel de significancia en las pruebas individuales, por lo que comete menos errores de tipo I (para hacerlo más comparable con la prueba general en el nivel de significancia ), es menos probable que encuentre un efecto significativo (cede el poder reduciendo la tasa de error tipo I).α
Incluso si no tiene en cuenta las pruebas múltiples al cambiar el nivel de significación, las estadísticas univariadas pueden ser fácilmente insignificantes cuando existe una relación conjunta clara que involucra a ambas.
Aquí hay un ejemplo. Primero, algunos datos:
Salida de regresión (de R :)
El valor p más pequeño es 0.114: no habría rechazado la hipótesis nula de no asociación incluso al nivel de significación del 10%, pero la regresión general conduciría al rechazo incluso si su nivel de significación fuera del 1%. Esto es sin siquiera tratar con el problema de las pruebas múltiples.
Tampoco es útil ejecutar regresiones separadas y verificar los valores p allí, porque (en un tipo de ejemplo diferente al anterior) es bastante posible que no haya relación en las regresiones univariadas, mientras que hay una relación fuerte en la regresión bivariada .
fuente