La prueba de Sharipo-Wilk, de acuerdo con Wikipedia , prueba la hipótesis nula ( ) "La población se distribuye normalmente".
Estoy buscando una prueba de normalidad similar con "La población no está distribuida normalmente".
Teniendo tal prueba, quiero calcular un valor para rechazar en el nivel de significancia iff ; demostrando que mi población está normalmente distribuida.H 0 α p < α
Tenga en cuenta que usar la prueba de Sharipo-Wilk y aceptar iff es un enfoque incorrecto, ya que literalmente significa "no tenemos suficiente evidencia para demostrar que H0 no se cumple". p > α
Hilos relacionados - significado del valor , ¿ es inútil la prueba de normalidad? , pero no puedo ver una solución a mi problema.
Las preguntas: ¿Qué prueba debo usar? ¿Se implementa en R?
Respuestas:
No existe una prueba de que sus datos se distribuyen normalmente. Solo hay pruebas de que sus datos no se distribuyen normalmente. Por lo tanto, hay pruebas como la de Shapiro-Wilk donde (hay muchas otras), pero no hay pruebas donde la nula es que la población no es normal y la hipótesis alternativa es que la población es normal.H0:normal
Todo lo que puede hacer es averiguar qué tipo de desviación de la normalidad le interesa (por ejemplo, asimetría) y qué tan grande debería ser esa desviación antes de que le moleste. Luego, podría probar para ver si la desviación de la normalidad perfecta en sus datos fue menor que la cantidad crítica. Para obtener más información sobre la idea general, podría ser útil leer mi respuesta aquí: ¿por qué los estadísticos dicen que un resultado no significativo significa "no se puede rechazar lo nulo" en lugar de aceptar la hipótesis nula?
fuente
La distribución normal surge cuando los datos son generados por una serie de eventos aditivos (vea la imagen de quincunx a continuación). Eso significa que no hay retroalimentación ni correlaciones, ¿eso suena como el proceso que lidera sus datos? Si no, probablemente no sea normal.
Existe la posibilidad de que ese tipo de proceso pueda estar ocurriendo en su caso. Lo más cercano que puede llegar a "probar" es recopilar datos suficientes para descartar cualquier otra distribución que las personas puedan tener (lo que probablemente no sea práctico). Otra forma es deducir la distribución normal de alguna teoría junto con algunas otras predicciones. Si los datos son consistentes con todos ellos y nadie puede pensar en otra explicación, esa sería una buena evidencia a favor de la distribución normal.
https://en.wikipedia.org/wiki/Bean_machine
Ahora, si no espera ninguna distribución específica a priori, aún puede ser razonable usar la distribución normal para resumir los datos, pero reconozca que esto es esencialmente una elección por ignorancia ( https://en.wikipedia.org/wiki/ Principio_de_entropía máxima ). En este caso, no desea saber si la población está normalmente distribuida, sino saber si la distribución normal es una aproximación razonable para el próximo paso.
En ese caso, debe proporcionar sus datos (o datos generados que sean similares) junto con una descripción de lo que planea hacer con ellos, luego preguntar "¿De qué maneras puede suponer normalidad en este caso confundirme?"
fuente
Nunca podrá "probar" una suposición de Normalidad en sus datos. Solo ofrezca evidencia en su contra como una suposición. La prueba de Shapiro-Wilk es una forma de hacer esto y se usa todo el tiempo para justificar el supuesto de Normalidad. El razonamiento es que comienzas asumiendo Normalidad. Luego preguntas, ¿mi información sugiere que estoy haciendo una suposición tonta? Así que adelante, pruébelo con Shapiro-Wilk. Si no puede rechazar la hipótesis nula, los datos no sugieren que esté haciendo una suposición tonta.
Tenga en cuenta que las personas usan esta lógica similar todo el tiempo en la práctica, no solo en el contexto de la prueba de Shapiro-Wilk. Quieren usar la regresión lineal, mirar un diagrama de dispersión y ver si la regresión lineal es una idea tonta. O suponen términos de heteroscedasticidad y error de trama para ver si es una idea tonta.Y,X
fuente