¿Cuáles son las formas más aceptadas de visualizar los resultados de una prueba t independiente de dos muestras? ¿Se usa con mayor frecuencia una tabla numérica o algún tipo de gráfico? El objetivo es que un observador casual mire la figura e inmediatamente vea que probablemente sean de dos poblaciones diferentes.
data-visualization
t-test
cbake
fuente
fuente
Respuestas:
Vale la pena tener claro el propósito de su trama. En general, hay dos tipos diferentes de objetivos: puede hacer gráficos para usted mismo para evaluar los supuestos que está haciendo y guiar el proceso de análisis de datos, o puede hacer gráficos para comunicar un resultado a los demás. Estos no son lo mismo; por ejemplo, muchos espectadores / lectores de su trama / análisis pueden ser estadísticamente poco sofisticados y pueden no estar familiarizados con la idea de, por ejemplo, la varianza igual y su papel en una prueba t. Desea que su trama transmita la información importante sobre sus datos incluso a consumidores como ellos. Están confiando implícitamente en que has hecho las cosas correctamente. De la configuración de su pregunta, supongo que está detrás del último tipo.
Siendo realistas, el gráfico más común y aceptado para comunicar los resultados de una prueba t 1 a otros (dejando de lado si es realmente el más apropiado) es un gráfico de barras de medias con barras de error estándar. Esto coincide muy bien con la prueba t porque una prueba t compara dos medios usando sus errores estándar. Cuando tiene dos grupos independientes, esto generará una imagen intuitiva, incluso para los que no son estadísticamente sofisticados, y las personas (que deseen datos) pueden "ver de inmediato que probablemente son de dos poblaciones diferentes". Aquí hay un ejemplo simple usando los datos de @ Tim:
Dicho esto, los especialistas en visualización de datos suelen despreciar estas tramas. A menudo se los ridiculiza como "diagramas de dinamita" (cf. Por qué los diagramas de dinamita son malos ) En particular, si solo tiene unos pocos datos, a menudo se recomienda que simplemente muestre los datos ellos mismos . Si los puntos se superponen, puede fluctuarlos horizontalmente (agregue una pequeña cantidad de ruido aleatorio) para que ya no se superpongan. Debido a que una prueba t es fundamentalmente sobre las medias y los errores estándar, es mejor superponer las medias y los errores estándar en dicho gráfico. Aquí hay una versión diferente:
Si tiene muchos datos, los diagramas de caja pueden ser una mejor opción para obtener una visión general rápida de las distribuciones, y también puede superponer los medios y los SE allí.
Las gráficas simples de los datos, y las gráficas de caja, son lo suficientemente simples como para que la mayoría de las personas puedan comprenderlas incluso si no son muy conocedoras de las estadísticas. Sin embargo, tenga en cuenta que ninguno de estos facilita la evaluación de la validez de haber utilizado una prueba t para comparar sus grupos. Esos objetivos se cumplen mejor con diferentes tipos de tramas.
1. Tenga en cuenta que esta discusión supone una prueba t de muestras independientes. Estas gráficas podrían usarse con una prueba t de muestras dependientes, pero también podrían ser engañosas en ese contexto (cf. ¿Está mal el uso de barras de error para las medias en un estudio dentro de los sujetos? ).
fuente
La forma más utilizada para visualizar la comparación tipo -test es usar boxplots . A continuación, proporciono un ejemplo utilizando un conjunto de datos que describe "la relación entre fumar marihuana y un déficit en el rendimiento en una tarea que mide la memoria a corto plazo" de este sitio .t
En realidad, los diagramas de caja se usan comúnmente para la prueba de hipótesis "informal", por ejemplo, según lo descrito por Yoav Benjamini en el artículo de 1988 Abrir la caja de un diagrama de caja :
Ver también: prueba T usando solo datos de resumen en un diagrama de caja
Este gráfico no muestra cantidades directamente involucradas en -test, como notó @NickCox . Si desea una comparación directa de medias con intervalos de confianza, puede usar un diagrama de barras con intervalos de confianza marcados. El uso de medias e intervalos de confianza también le permite realizar una prueba de hipótesis (ver aquí o aquí ).t
Como puede ver en otras publicaciones y comentarios en este hilo, tanto los gráficos de caja como los gráficos de dinamita son una opción algo controvertida, así que permítame darle una alternativa más que aún no se mencionó. Primero, recuerde que prueba y la regresión están relacionadas . Puede trazar una comparación tipo -test como dos puntos con barras de error (intervalos de confianza) que están conectados con la línea. La pendiente de la línea es proporcional a la pendiente de regresión si usó regresión lineal en lugar det tt t t -prueba en esta situación. La principal ventaja de este gráfico es que le permite juzgar fácilmente la magnitud de la diferencia de medias mirando la pendiente de la línea. La desventaja puede ser que puede sugerir que existe cierta "continuidad" entre los medios (es decir, que tenía muestras emparejadas).
Los diagramas de caja parecen ser más utilizados ya que proporcionan más información sobre la distribución de las variables visualizadas (en comparación con la media con el intervalo de confianza solamente) También complementan, en lugar de duplicar, la información de test y tal uso de la trama es alentado por la mayoría de las guías de estilo, por ejemplo, por el Manual de Publicaciones de la Asociación Americana de Psicología :t
fuente
Esto es principalmente una variación de las útiles respuestas de @Tim y @gung, pero los gráficos no se pueden incluir en un comentario.
Puntos pequeños pero posiblemente útiles:
Un diagrama de tiras o un diagrama de puntos como se ilustra en @gung necesita modificación si hay vínculos, como en los datos de ejemplo. Los puntos pueden apilarse o fluctuar, o como en el ejemplo a continuación, puede usar un diagrama híbrido de caja de cuantiles como lo sugiere Emanuel Parzen (la referencia más accesible es probablemente 1979. Modelado de datos estadísticos no paramétricos. Journal, American Statistical Association74: 105-121). Esto también tiene otros méritos, al subrayar que si la mitad de los datos están dentro del cuadro, entonces la mitad también está afuera, y al mostrar esencialmente todos los detalles de la distribución. Donde solo hay dos grupos, como en este contexto, cualquier tipo de diagrama de caja más convencional puede ser una pantalla mínima, de hecho esquelética. Algunos lo tomarían como una virtud, pero hay margen para mostrar más detalles. El argumento inverso es que un diagrama de caja que marca puntos particulares, especialmente aquellos a más de 1.5 IQR del cuartil más cercano, es una advertencia clara para el usuario: tenga cuidado con una prueba t, ya que puede haber puntos en las colas que debería preocuparse por
Naturalmente, puede agregar una indicación de los medios a un diagrama de caja, que a menudo se realiza. Agregar un marcador diferente o un símbolo de punto es común. Aquí elegimos líneas de referencia.
Gráficos de caja de cuantiles para fumadores y no fumadores. Las cajas muestran medianas y cuartiles. Las líneas horizontales en azul muestran los medios.
Nota. El gráfico fue creado en Stata. Aquí está el código para los interesados.
stripplot
debe instalarse previamente conssc inst stripplot
.EDITAR. Esta idea adicional en respuesta a la respuesta de @Frank Harrell superpone dos gráficos de probabilidad normal (realmente gráficos de cuantil-cuantil). Las líneas horizontales muestran medias. Algunos desearían agregar líneas para cada grupo que indiquen un ajuste perfecto, por ejemplo, a través de ( , su media) y ( , su media su DE) o alternativas resistentes resistentes.1 +0 1 +
fuente
Además del buen objetivo de presentar los resultados, debe tenerse en cuenta qué gráficos verifican los supuestos de la prueba varianza igual de dos muestras para que tenga un rendimiento excelente. Eso sería funciones inversas normales de las dos funciones de distribución acumulativa empírica. Para satisfacer los supuestos de la prueba, estas dos curvas deben ser líneas rectas paralelas.t
fuente