¿Cuál es el nombre de esta gráfica usando líneas verticales para mostrar una distribución?

14

¿Existe un nombre oficial para este gráfico extremadamente simple, en el que las líneas verticales indican la distribución de algunas muestras en un rango?

ingrese la descripción de la imagen aquí

enero
fuente
8
"alfombra", cuando se usa con otras parcelas.
Gimelist
77
No hay nombre oficial. Mucho depende de si el uso de líneas verticales es esencial, o si se aceptarían otros símbolos, y de si se permite el apilamiento o la fluctuación cuando hay vínculos. En stats.stackexchange.com/questions/102735/… le doy 22 nombres diferentes encontrados para el sentido más amplio de este tipo de trama.
Nick Cox

Respuestas:

24

El primer ejemplo en el que los he visto hacer referencia son las tiras que muestran distribuciones empíricas: I. tiras de puntos con textura (Tukey y Tukey, 1990), aunque nunca he podido obtener ese informe técnico.

Tim tiene razón: a menudo se acompañan como la alfombra en una parcela adicional para mostrar la ubicación de las observaciones individuales, pero la trama de la alfombra es un poco más general y ese tipo de trama no siempre está en la alfombra de otra trama, como muestra su pregunta.

  • Aquí hay un ejemplo del uso de puntos en la alfombra en lugar de líneas.
  • Aquí hay un ejemplo de que la alfombra es puntos y no muestra todos los datos, sino solo los datos que faltan en la otra dimensión de un diagrama de dispersión.

Entonces, un diagrama de alfombra no siempre es un conjunto de líneas en los bordes de otro gráfico, y ese tipo de diagrama en su pregunta no siempre está en los márgenes de otro diagrama. Aquí hay un ejemplo de las líneas superpuestas en una densidad de kernel en lugar de en la alfombra de la trama, llamada beanplot . Creo que las líneas más grandes se usan para visualizar diferentes cuantiles (también conocidos como valores de letras) de la distribución.


(fuente: biomedcentral.com )

En la Gramática de Gráficos de Wilkinson, puede considerarse un diagrama de dispersión unidimensional, pero utiliza segmentos de línea en lugar del valor predeterminado típico de los círculos. El objetivo de esto es evitar que muchos de los puntos cercanos se superpongan. Si tiene muchos puntos y los dibuja de forma semitransparente, eventualmente se convertirán en una franja de densidad, vea la imagen final en esta publicación .

Incluso los he visto sugeridos para usar como minigráficos ( Greenhill et al., 2011 ) en ese ejemplo para visualizar datos binarios. Greenhill los llama en ese ejemplo diagramas de separación , y aquí hay un ejemplo tomado del documento de referencia (p.995):

ingrese la descripción de la imagen aquí

Entonces, en ese ejemplo, hay valores a lo largo de todo el eje, y el color se usa para visualizar una variable binaria. La línea negra en ese gráfico es la proporción acumulativa de observaciones rojas.

Andy W
fuente
66
+1 Gráfico de tiras también es un término común.
whuber
1
@whuber: trazado de franjas, sí, o un gráfico de franjas .
ameba dice Reinstate Monica
1/nnnorte
Esa es una descripción justa @NickCox, pero no creo que los gráficos de separación sean tan diferentes. En la gramática de Wilkinson se puede considerar un diagrama de dispersión unidimensional, con el rango en la dimensión única y luego usando el color para distinguir entre los dos tipos de puntos. Con solo dos tipos de puntos, ni siquiera necesita tener los datos para uno de los conjuntos, por lo que el gráfico original del OP podría ser un diagrama de separación con las barras negras mostrando una categoría y el fondo gris como complemento.
Andy W
No es tan diferente de algunas chispas que he visto visualizando victorias / derrotas para equipos deportivos. (Todos los gráficos deben asignarse a un intervalo finito para proyectar los datos en la página / pantalla de la computadora, por lo que si los datos reales están restringidos al intervalo de la unidad, no creo que sea material para describir el gráfico en sí). No llamaría un diagrama de dispersión de datos clasificados con un nombre diferente porque los puntos no se colocan "donde pertenecen".
Andy W
20

Se llama una trama de alfombra (ver, por ejemplo, aquí o aquí ). En R se puede hacer con una rugfunción.

La trama parece aparecer también con otro nombre, como tabla de franjas , Phillip I. lo llama así en Introducción a las estadísticas mediante métodos de remuestreo y R / S-Plus (2005, Wiley). En R se llama por stripchartfunción.

Parece que la versión pequeña que a menudo acompaña a un diagrama más grande se llama diagrama de alfombra, mientras que el diagrama independiente hecho de puntos o líneas verticales se llama diagrama de tiras.

Tim
fuente
Maldición, estaba tan cerca: estaba buscando un trapo de trapo (y, como era de esperar, no se me ocurrió nada). ¡Gracias!
enero
2
Creo que, en la práctica, las personas solo se refieren a tramas como las de alfombra cuando son marginales a algún otro punto, como un histograma o una gráfica de dispersión.
Nick Cox
3

En el etiquetado comercial de productos, código de barras o

si son líneas de frecuencia trazadas a tiempo, Spectrum .

EDITAR1

Cuando en nubes electromagnéticas o cromatógrafos de gases las fuerzas se trazan linealmente en la escala de frecuencia, entonces también podemos decir Spectrum.

Narasimham
fuente
3
Hola, bienvenido al sitio. Desafortunadamente, esto no responde a la pregunta ya que las líneas en los códigos de barras o espectros no "indican la distribución de algunas muestras en un rango" como lo especifica la pregunta.
Juho Kokkala
44
@JuhoKokkala No estoy de acuerdo en parte. Los códigos de barras utilizados en la industria no coinciden, de acuerdo, pero el término gráfico de código de barras se ha utilizado para indicar este tipo de gráfico para datos reales. Del mismo modo, los datos espectroscópicos seguramente también califican como datos. No me apegaría a la redacción del OP ya que confunde "muestras" y "valores de muestra".
Nick Cox
2
La trama de la alfombra es la más cercana, estoy de acuerdo. Pero también se le ha llamado diagrama de código de barras. Sin embargo, el diagrama de código de barras a menudo tiene grosor de línea, o sombra / transparencia, para mostrar la densidad de los valores localizados. Utilizamos mucho este tipo de diagrama con datos de ADN para marcar ubicaciones de características.
Dianne Cook
0

Tengo el mismo problema: ¿Cuál es el nombre del "código de barras" como la visualización de datos verdaderos / falsos?

Mi objetivo es representar una lista de matrices verdadero / falso correspondiente a una matriz de palabras en un lugar fijo en la matriz. Como representación del "espectro de luz" para identificar el surtido de una onda de luz específica ... en una misma situación, quiero enfatizar las palabras que faltan y las palabras presentes

Me encontré en Vega the Strip Plot

https://vega.github.io/vega-lite/examples/tick_strip.html

Creo que para mi objetivo es un mejor nombre para representar mi idea de visualización

Domenico M.
fuente