Me piden que escriba una introducción a las estadísticas y estoy luchando por cómo mostrar gráficamente la forma en que se relacionan el valor p y el poder. Se me ocurrió este gráfico:
Mi pregunta: ¿hay una mejor manera de mostrar esto?
Aquí está mi código R
x <- seq(-4, 4, length=1000)
hx <- dnorm(x, mean=0, sd=1)
plot(x, hx, type="n", xlim=c(-4, 8), ylim=c(0, 0.5),
ylab = "",
xlab = "",
main= expression(paste("Type II (", beta, ") error")), axes=FALSE)
axis(1, at = c(-qnorm(.025), 0, -4),
labels = expression("p-value", 0, -infinity ))
shift = qnorm(1-0.025, mean=0, sd=1)*1.7
xfit2 <- x + shift
yfit2 <- dnorm(xfit2, mean=shift, sd=1)
# Print null hypothesis area
col_null = "#DDDDDD"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null)
lines(x, hx, lwd=2)
# The alternative hypothesis area
## The red - underpowered area
lb <- min(xfit2)
ub <- round(qnorm(.975),2)
col1 = "#CC2222"
i <- xfit2 >= lb & xfit2 <= ub
polygon(c(lb,xfit2[i],ub), c(0,yfit2[i],0), col=col1)
## The green area where the power is
col2 = "#22CC22"
i <- xfit2 >= ub
polygon(c(ub,xfit2[i],max(xfit2)), c(0,yfit2[i],0), col=col2)
# Outline the alternative hypothesis
lines(xfit2, yfit2, lwd=2)
axis(1, at = (c(ub, max(xfit2))), labels=c("", expression(infinity)),
col=col2, lwd=1, lwd.tick=FALSE)
legend("topright", inset=.05, title="Color",
c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), horiz=FALSE)
abline(v=ub, lwd=2, col="#000088", lty="dashed")
arrows(ub, 0.45, ub+1, 0.45, lwd=3, col="#008800")
arrows(ub, 0.45, ub-1, 0.45, lwd=3, col="#880000")
Actualizar
Gracias por las excelentes respuestas. He cambiado algo del código:
# Print null hypothesis area
col_null = "#AAAAAA"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null, lwd=2, density=c(10, 40), angle=-45, border=0)
lines(x, hx, lwd=2, lty="dashed", col=col_null)
...
legend("topright", inset=.015, title="Color",
c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2),
angle=-45,
density=c(20, 1000, 1000), horiz=FALSE)
Me gusta la imagen discontinua y ligeramente vaga de la hipótesis nula porque indica que no está realmente allí. He pensado en la transparencia y en agregar el alfa, pero me preocupa obtener demasiada información en una imagen y, por lo tanto, he decidido no hacerlo.
Las limitaciones de los artículos impresos no me permiten dejar que los lectores experimenten. Elegí la respuesta de @Greg Snow con TeachingDemos como mi respuesta, ya que me encanta la idea con los dos errores que no se superponen.
Respuestas:
He jugado con tramas similares y descubrí que funciona mejor cuando las 2 curvas no se bloquean entre sí, sino que están más bien desplazadas verticalmente (pero aún en el mismo eje x). Esto deja en claro que una de las curvas representa la hipótesis nula y la otra representa un valor dado para la media bajo la hipótesis alternativa. La
power.examp
función en el paquete TeachingDemos para R creará estos gráficos y larun.power.examp
función (mismo paquete) le permite cambiar interactivamente los argumentos y actualizar el gráfico.fuente
TeachingDemos
paquete, pero era demasiado perezoso para buscarlo.)Algunas reflexiones: (a) Use transparencia y (b) Permita cierta interactividad.
Aquí está mi opinión, inspirada en gran medida por un applet de Java sobre errores de tipo I y tipo II: cometer errores en el sistema de justicia . Como este es un código de dibujo bastante puro, lo pegué como la esencia # 1139310 .
Así es como se ve:
fuente
aplpack
paquete también tiene algunos buenos complementos para la visualización de datos. Sin embargo, el rpanel , que también se basa en tcl / tk, es probablemente una mejor opción para cosas más complejas. Ahora, con RStudio y el paquete de manipulación , también es fácil mejorar la trama básica en R.G Power 3 , software gratuito disponible en Mac y Windows, tiene algunas características gráficas muy buenas para el análisis de energía. El gráfico principal es ampliamente coherente con su gráfico y el que muestra @chl. Utiliza una línea recta simple para indicar hipótesis nulas y distribuciones estadísticas de pruebas de hipótesis alternativas, y colores en beta y alfa en colores separados.
Una buena característica de G Power 3 es que admite una gran cantidad de escenarios comunes de análisis de potencia y la GUI hace que sea fácil de explorar para estudiantes e investigadores aplicados.
Aquí hay una captura de pantalla de una diapositiva (tomada de una presentación que di sobre estadísticas descriptivas con una sección sobre análisis de potencia ) con múltiples de estos gráficos que se muestran a la izquierda. Si elige una versión de prueba t de una cola, se parecería más a su ejemplo.
También es posible producir gráficos que muestren la relación funcional entre los factores relevantes para el poder estadístico y las pruebas de hipótesis (p. Ej., Alfa, tamaño del efecto, tamaño de la muestra, poder, etc.). Presento algunos ejemplos de tales gráficos aquí . Aquí hay un ejemplo de tal gráfico:
fuente