¿Existe un "hola, mundo" para los gráficos estadísticos?

26

En la programación de computadoras, hay un primer programa clásico para aprender / enseñar un nuevo lenguaje o sistema, llamado "hola, mundo". http://en.wikipedia.org/wiki/Hello_world_program

¿Existe una primera visualización de datos clásica para usar un paquete de gráficos? Si es así, ¿qué es? Y si no, ¿cuáles serían buenos candidatos?

Abraham D Flaxman
fuente
3
¡Bienvenido a nuestro sitio! Nuestras preguntas frecuentes le piden que "solo debe hacer preguntas prácticas y que respondan en función de los problemas reales que enfrenta". ¿Podría explicar cuál es su problema real?
whuber
3
Me gustaría identificar el "elemento de prueba estándar" para gráficos estadísticos, si existe, para incluir en el material de capacitación que estoy desarrollando.
Abraham D Flaxman
2
Debido a que las aplicaciones gráficas varían tanto, es difícil concebir algún gráfico estándar o universal. No son algunas normas para ciertos tipos de paquetes de gráficos, tales como conejos históricamente famosos y teteras para gráficos en 3D. Para que su pregunta responda, sería útil que fuera más específica sobre qué paquete (s) su material de capacitación tendrá la intención de cubrir.
whuber
1
Buen punto, gracias. Incluiré al menos algo sobre gráficos estadísticos en R, STATA, Python y Javascript.
Abraham D Flaxman
@AbrahamDFlaxman Tengo curiosidad por este "material de capacitación" y para quién y para qué está destinado. ¿Puedes decir más?
Peter Flom - Restablece a Monica

Respuestas:

9

Dos pensamientos:

R. Cuando trato de llegar a la esencia de "Hello World", es lo mínimo que se debe hacer en el lenguaje de programación para generar un programa válido que imprima una sola línea de texto. Eso me sugiere que su "Hello World" debería ser un conjunto de datos univariante, lo más básico que podría conectar a un programa estadístico o gráfico.

B. No estoy al tanto de ningún gráfico "Hello World". Lo más cerca que puedo llegar son los conjuntos de datos típicos que se incluyen en varios paquetes estadísticos, como los AirPassengers de R. En R, una declaración gráfica de Hello World sería:

plot (AirPassengers)  # Base graphics, prints line graph

o

qplot (AirPassengers) # ggplot2, prints a bar chart

o

xyplot (AirPassengers) # lattice, which doesn't have a generic plot

Personalmente, creo que el gráfico más simple es un gráfico lineal donde tienes N elementos en Y y X varía de 1: N. Pero eso no es un estándar.

Wayne
fuente
2
El consenso de esta y otras respuestas es que actualmente no hay un "hola, mundo" de gráficos estadísticos. Creo que su sugerencia de un conjunto de datos univariante, con N elementos en Y y X que van desde 1: N es convincente. En analogía adicional con "hola, mundo", sería bueno tener una N pequeña y una Y memorable. ¿Qué opinas de N = 5 e Y = (3,1,4,1,5,9) (es decir, dígitos de pi)? Tal vez eso es demasiado mathy.
Abraham D Flaxman
1
@AbrahamDFlaxman: No creo que sea mathy, creo que es genial. Memorable, corto, y el gráfico no es solo una línea recta ni nada. Los datos son conocidos y no están vinculados a ningún programa en particular, y cualquier persona que desee más puntos puede ampliarlos arbitrariamente. ¡Voto por ello!
Wayne
24

Probablemente comenzaría con diagramas de dispersión y demostraría las cuatro correlaciones feas .

StasK
fuente
2
+1. Pero es posible que desee considerar algo un poco más general, como alguna forma de trazado lineal. Después de todo, tan pronto como pueda dibujar un segmento de línea, puede dibujar cualquier cosa . Esto se hace eco de la idea detrás de "¡Hola, mundo!": Una vez que puede obtener una salida legible de un programa, sabe que puede comunicarse con la computadora y el resto son solo detalles :-). (Los detalles pueden ser difíciles . Al aprender a escribir el código de ensamblaje para el mainframe IBM 360, la forma más sencilla de obtener resultados era almacenarlo en la RAM y crear un error al final de la ejecución, lo que hace que el sistema imprima un volcado de núcleo hexadecimal !)
whuber
Creo que el cuarteto de Anscombe en total contiene demasiado para ser utilizado como el "hola, mundo" de los gráficos estadísticos, pero la Figura 1 de su artículo podría ser un buen candidato. Sin embargo, otras respuestas han justificado un conjunto de datos univariado, al que me inclino.
Abraham D Flaxman
7

El histograma de una muestra de una variable aleatoria normalmente distribuida.

Karsten W.
fuente
Me gusta cómo se vería esto, pero tal vez los histogramas requieren más procesamiento de datos que los dispersos, y generar muestras de la distribución normal puede ser una distracción.
Abraham D Flaxman
Acabo de notar que este es el primer ejemplo de la página web de Matplotlib: matplotlib.org
Abraham D Flaxman
5

Creo que la respuesta es "no". Es decir, generalmente no hay una respuesta acordada para su pregunta.

@StasK apunta al diagrama de dispersión.

Pero consideraría lo que plothace en R: ¡Depende de los datos!

Se podría argumentar que las estadísticas univariadas son más simples que las bivariadas. Entonces ... quizás lo más básico es un histograma; o tal vez un diagrama de barras; Tal vez un diagrama de densidad.

Si el punto de "Hola, mundo!" es mostrar que puedes hacer que la computadora haga algo, entonces yo diría que cualquier trama funcionaría.

Peter Flom - Restablece a Monica
fuente
1
Quizás la ausencia de un ítem de prueba estándar indica que usted está en lo correcto, y es más apropiado usar cualquier gráfico que sea más simple en el sistema que se está demostrando. Sin embargo, eso dificulta la comparación.
Abraham D Flaxman
5

No estoy seguro si califica exactamente como hello world, pero en R también hay demos integradas en muchos paquetes. p.ej

library(graphics)
demo(graphics)

guiará al usuario a través de algunos gráficos básicos disponibles en el paquete. Simplemente haga clic con el mouse sobre cada imagen para ver las ilustraciones gráficas básicas. Con solo dos líneas, el usuario se introduce en algunas de las capacidades inspiradoras de los gráficos R para estadísticas.

El código correspondiente para generar los gráficos se muestra en la consola R.

ingrese la descripción de la imagen aquí

palmadita
fuente
2

Yo diría que hubo dos programas tipo "Hola Mundo" para la visualización de datos:

Imprimir ("Hello World"): algo así como el histograma de una variable normalmente distribuida, o quizás un simple diagrama de dispersión X, Y.

Para algo un poco más complejo, como la sección donde uno toma los principios de Hello World y comienza a jugar con la entrada del usuario, los caracteres de escape y similares, diría que estaría jugando con el conjunto de datos de Iris.

Fomite
fuente