Soy muy nuevo con R y las estadísticas en general, pero necesito hacer un diagrama de dispersión que creo que podría estar más allá de sus capacidades nativas.
Tengo un par de vectores de observaciones y quiero hacer un diagrama de dispersión con ellos, y cada par se divide en una de tres categorías. Me gustaría hacer un diagrama de dispersión que separe cada categoría, ya sea por color o por símbolo. Creo que esto sería mejor que generar tres diagramas de dispersión diferentes.
Tengo otro problema con el hecho de que en cada una de las categorías, hay grandes grupos en un punto, pero los grupos son más grandes en un grupo que en los otros dos.
¿Alguien sabe una buena manera de hacer esto? ¿Paquetes que debo instalar y aprender a usar? Alguien hizo algo similar?
Gracias
Este es uno de los problemas clásicos para el conjunto de datos 'Iris'. Este es un enlace a un conjunto completo de proyectos de trazado basados en ese conjunto de datos con código R, que puede adaptar a su problema.
Aquí hay un enfoque que se usa con base R en lugar de un paquete complementario.
que produce esta figura:
A partir de ahí, dependiendo de su trama, puede comenzar a jugar con los niveles alfa / transparencia para permitir la sobreplotación, etc., pero primero me basaría en un gráfico muy básico.
Si bien hay muchas razones para seguir con la base R, otros paquetes simplifican el trazado. Separar los datos por una característica distintiva es uno de los puntos fuertes de los paquetes ggplot2 y reticular . ggplot2 crea gráficos particularmente atractivos visualmente. Ambos paquetes se muestran en la respuesta de @cbeleites.
fuente
O con ggplot2:
Que produce
fuente