El estadístico de prueba de Durbin-Watson puede encontrarse en una región no concluyente, donde no es posible rechazar o no rechazar la hipótesis nula (en este caso, de autocorrelación cero).
¿Qué otras pruebas estadísticas pueden producir resultados "no concluyentes"?
¿Existe una explicación general (agitar las manos está bien) por qué este conjunto de pruebas no puede tomar una decisión binaria de "rechazar" / "no rechazar"?
Sería una ventaja si alguien pudiera mencionar las implicaciones teóricas de la decisión como parte de su respuesta a la última pregunta: ¿la presencia de una categoría adicional de (in) conclusión significa que debemos considerar los costos de Tipo I y Tipo II errores de una manera más sofisticada?
Respuestas:
El artículo de Wikipedia explica que la distribución del estadístico de prueba bajo la hipótesis nula depende de la matriz de diseño, la configuración particular de los valores predictores utilizados en la regresión. Durbin & Watson calcularon los límites inferiores para el estadístico de prueba bajo el cual la prueba de autocorrelación positiva debe rechazar, a niveles de significancia dados, para cualquier matriz de diseño, y los límites superiores sobre los cuales la prueba no puede rechazar para cualquier matriz de diseño. La "región no concluyente" es simplemente la región en la que tendría que calcular valores críticos exactos, teniendo en cuenta su matriz de diseño, para obtener una respuesta definitiva.
Una situación análoga sería tener que realizar una prueba t de una muestra y una cola cuando conoces solo el estadístico t, y no el tamaño de la muestra † : 1.645 y 6.31 (correspondiente a infinitos grados de libertad y solo una) los límites para una prueba de tamaño 0.05.
En lo que respecta a la teoría de la decisión, tiene que tener en cuenta una nueva fuente de incertidumbre además de la variación de muestreo, pero no veo por qué no debería aplicarse de la misma manera que con las hipótesis nulas compuestas. Estás en la misma situación que alguien con un parámetro de molestia desconocido, independientemente de cómo llegaste allí; así que si necesita tomar una decisión de rechazo / retención mientras controla el error Tipo I sobre todas las posibilidades, rechace conservadoramente (es decir, cuando la estadística de Durbin-Watson está por debajo del límite inferior, o la estadística t es superior a 6.31).
† O tal vez has perdido tus mesas; pero puede recordar algunos valores críticos para un Gaussiano estándar y la fórmula para la función cuantil de Cauchy.
fuente
Otro ejemplo de una prueba con resultados posiblemente no concluyentes es una prueba binomial para una proporción cuando solo está disponible la proporción, no el tamaño de la muestra. Esto no es completamente irreal: a menudo vemos o escuchamos reclamos mal informados de la forma "73% de las personas están de acuerdo en que ..." y así sucesivamente, donde el denominador no está disponible.
De hecho, es el porcentaje redondeado más alto por debajo del 50% para ser inequívocamente significativo al nivel del 5% (su valor p más alto sería para 4 éxitos en 17 ensayos y es solo significativo), mientras que es el resultado más bajo distinto de cero que no es concluyente (porque podría corresponder a 1 éxito en 8 ensayos). Como se puede ver en los ejemplos anteriores, ¡lo que sucede en el medio es más complicado! El siguiente gráfico tiene una línea roja en : los puntos debajo de la línea son inequívocamente significativos, pero los de arriba no son concluyentes. El patrón de los valores p es tal que no habrá límites inferiores y superiores únicos en el porcentaje observado para que los resultados sean inequívocamente significativos.p = 13 % α = 0.05p=24% p=13% α=0.05
Código R
(El código de redondeo se recorta de esta pregunta de StackOverflow ).
fuente