¿Cuáles son algunas opciones populares para visualizar datos de 4 dimensiones?

12

Digamos que tengo los siguientes datos de cuatro dimensiones, donde los primeros tres pueden considerarse como coordenadas, y el último puede considerarse como valores.

c1, c2, c3, value
1, 2, 6, 0.456
34, 34, 12 0.27
12, 1, 66 0.95

¿Cómo visualizar mejor el efecto de las tres primeras coordenadas en el último valor?

Conozco tres métodos.

Una es la gráfica 3D para las primeras tres coordenadas con el tamaño de los puntos como el valor cuatro. Pero no es tan fácil ver la tendencia en los datos.

Otro está usando una serie de trama 3D, cada una de las cuales tiene una coordenada fija. ingrese la descripción de la imagen aquí

Otro puede ser los llamados "gráficos enrejados" en celosía de R. No es seguro que sea para este propósito, pero parece que sí. ingrese la descripción de la imagen aquí

Tyler 傲 来 国 主
fuente
2
¿Necesita una pantalla estática (por ejemplo, para un papel)?
gung - Restablece a Monica

Respuestas:

12

Si los tres primeros son solo coordenadas espaciales y los datos son escasos, simplemente puede hacer un diagrama de dispersión 3D con puntos de diferentes tamaños o colores para el valor.

Se parece a esto: (fuente: gatech.edu )Dispersión

Si sus datos están destinados a ser de naturaleza continua y existen en una cuadrícula de celosía, puede trazar varios isocontornos de los datos utilizando Cubos de Marcha .

Otro enfoque cuando tiene datos 4D densos es mostrar varios "cortes" 2D de los datos incrustados en 3D. Se verá algo como esto:

Rebanadas

mklingen
fuente
El diagrama de dispersión 3D coloreado solo es realmente adecuado para funciones continuas en datos 3D. Si el gradiente de la función cambia suavemente, puede ver algún patrón en la dispersión de puntos. Del mismo modo, la visualización del volumen en la parte inferior también funciona mejor en este escenario. Si la función es muy ruidosa, tendrá dificultades para ver algo. Si tiene 4 variables explicativas (como para hacer PCA o agrupar), graficando 3 en coordenadas euclidianas y la cuarta usando algún mapeo no lineal para colorear al introducir un sesgo perceptual, que no puede cuantificarse.
Dianne Cook
@DianneCook eso es cierto. Supongo que eso es lo que me pasa por trabajar siempre con movimientos suaves, 3D datos volumétricos continuos;)
mklingen
Oye, eso es lo que preguntó la pregunta% ^)
Dianne Cook
9

¿Tienes cuatro variables cuantitativas? Si es así, pruebe recorridos, diagramas de coordenadas paralelas, matrices de diagrama de dispersión. El paquete tourr (y tourrGui) en R ejecutará recorridos, básicamente rotación en altas dimensiones, puede elegir proyectar en 1D, 2D o más, y hay un documento JSS que puede leer para comenzar citado en el paquete. Los diagramas de coordenadas paralelas y las matrices de diagrama de dispersión están en el paquete GGally, también las matrices de diagrama de dispersión están en el paquete YaleToolkit. También puede consultar http://www.ggobi.org para ver videos y más documentación sobre todo esto.

Si sus datos son completamente categóricos, debe usar diagramas de mosaico o variantes. Eche un vistazo al paquete productplots en R, también vcd tiene algunas funciones razonables, o el paquete ggparallel para hacer el equivalente de gráficos de coordenadas paralelas para datos categóricos. Además, acabo de encontrar que el paquete extracat tiene algunas funciones para mostrar datos categóricos.

Leí mal la pregunta, originalmente, porque me detuve en la pregunta y no leí la descripción completa. Similar al enfoque a continuación (puntos de coloración en 3D), puede usar el pincel vinculado para explorar funciones definidas en espacios de alta dimensión. Tome un vistazo al video aquí , que muestra que hacen esto para una función normal multivariante 3D. El pincel pinta puntos con alta densidad (valores de función altos) y luego se mueve a valores de densidad cada vez más bajos (valores de función bajos). Las ubicaciones en las que se muestrea la función se muestran en un diagrama de dispersión giratorio en 3D, utilizando el recorrido, que también podría usarse para mirar dominios de 4, 5 o dimensiones superiores.

Dianne Cook
fuente
2

Prueba las caras de Chernoff . La idea es unir las variables a los rasgos faciales. Por ejemplo, el tamaño de la sonrisa sería una variable, la redondez de la cara es otra, etc. Por ridículo que parezca, esto en realidad puede funcionar si encuentra una forma inteligente de asignar variables a las características.

Otra forma es mostrar proyecciones en 2-d del diagrama de fase en 3-d. Digamos que tiene x1, x2, x3, x4 sus variables. Para cada valor de x4, dibuje un gráfico tridimensional de puntos (x1, x2, x3) y conecte los puntos. Esto funciona mejor cuando se ordena x4, por ejemplo, es la fecha o la hora.

ACTUALIZACIÓN: También puedes probar gráficos de burbujas. Tres dimensiones serían habitualmente cartesianas x, y, z, y la cuarta dimensión sería el tamaño del punto de burbuja.

Puede probar la animación, es decir, usar el tiempo como cuarta dimensión.

También una combinación de burbuja y animación: x, y, burbuja y tiempo.

Además, en relación con Chernoff está el diagrama de glifos , que puede parecer un poco más serio. Son estrellas con longitud de rayos proporcional a valores variables.

Aksakal
fuente
Gracias por la respuesta. Parece que la segunda opción es posible para mi problema. Creo que el primero no parece tan serio para un trabajo de investigación. Básicamente, me gustaría que la trama pueda revelar alguna tendencia o influencia de tres factores en el valor (cuarta dimensión).
Tyler 傲 来 国 主
55
Las caras de Chernoff fueron utilizadas en investigaciones serias, afaik.
Aksakal
1
Las caras de Chernoff pueden ser extraordinariamente útiles, especialmente cuando la dimensionalidad es de alrededor de 10-20 variables. Para cuatro dimensiones no son tan efectivas como otros tipos de representaciones gráficas.
whuber
3
¡Las caras de Chernoff son una idea terrible! Si tiene que usar un diagrama de iconos, use un diagrama de estrellas. Si tiene un conjunto de datos realmente pequeño, estos pueden ser útiles, ¡pero intente trazar 1000 iconos y vea si realmente puede ver algo!
Dianne Cook