Tengo algunos datos en los que hay 5 variables explicativas categóricas ( concern, breath, weath, sleep, act
) y 1 variable de respuesta continua ( tto
). Además, cada variable explicativa categórica se divide en 5 niveles que muestran cuán fuerte se siente una persona al respecto. el nivel 1 y el nivel 5 muestran los estados perfecto y peor respectivamente.
Me aconsejaron crear un diagrama de caja para ver la relación entre las variables explicativas y la variable de respuesta. La trama se da a continuación. Sin embargo, no sé cómo leer un diagrama de caja. ¿Alguien puede ayudarme a interpretarlo?
interpretation
boxplot
Günal
fuente
fuente
Respuestas:
La interpretación del diagrama de caja (alternativamente diagrama de caja y bigote) se basa en el entendimiento de que proporciona una representación gráfica de un resumen de cinco números, es decir, mínimo, primer cuartil, mediana, tercer cuartil y máximo. El cuadro abarca el 50% de las observaciones. Los extremos de los bigotes (líneas verticales que emanan de la parte superior e inferior de la caja) generalmente muestran dónde se encuentran el mínimo y el máximo. Sin embargo, cuando existen posibles valores atípicos (a veces evaluados en base a un rango intercuartil de 1.5 ), se agregan puntos, como es el caso de su figura.×
Puede ser útil para usted mirar un histograma o gráficos de densidad en categorías específicas de los datos, ya que eso puede ayudarlo a comprender lo que dice el diagrama de caja.
@Glen_b indica con razón que la inclinación hacia la izquierda es evidente y la tendencia central para el 5º nivel de fuerza de los sentimientos es más baja que las demás. Sin embargo, es difícil ver si esa diferencia sería estadísticamente significativa o no.
fuente
Aquí hay un resumen básico de lo que hay allí:
fuente