Cómo poner etiquetas individuales para un diagrama de dispersión

214

Estoy tratando de hacer un diagrama de dispersión en matplotlib y no pude encontrar una manera de agregar etiquetas a los puntos. Por ejemplo:

scatter1=plt.scatter(data1["x"], data1["y"], marker="o",
                     c="blue",
                     facecolors="white",
                     edgecolors="blue")

Quiero que los puntos en "y" tengan etiquetas como "punto 1", "punto 2", etc. No pude entenderlo.

J. Velazquez-Muriel
fuente

Respuestas:

374

Quizás use plt.annotate :

import numpy as np
import matplotlib.pyplot as plt

N = 10
data = np.random.random((N, 4))
labels = ['point{0}'.format(i) for i in range(N)]

plt.subplots_adjust(bottom = 0.1)
plt.scatter(
    data[:, 0], data[:, 1], marker='o', c=data[:, 2], s=data[:, 3] * 1500,
    cmap=plt.get_cmap('Spectral'))

for label, x, y in zip(labels, data[:, 0], data[:, 1]):
    plt.annotate(
        label,
        xy=(x, y), xytext=(-20, 20),
        textcoords='offset points', ha='right', va='bottom',
        bbox=dict(boxstyle='round,pad=0.5', fc='yellow', alpha=0.5),
        arrowprops=dict(arrowstyle = '->', connectionstyle='arc3,rad=0'))

plt.show()

ingrese la descripción de la imagen aquí

unutbu
fuente
8
Eso es lo que iba a decir. Enlace a documentos: matplotlib.sourceforge.net/api/… Enlace a demostración: matplotlib.sourceforge.net/examples/pylab_examples/…
Paul
44
@ubuntu ¿Es posible usar números (o etiquetas) en lugar de los puntos?
Vladtn
@Vladtn: puede cambiar las anotaciones redefiniendo la labelsvariable.
unutbu
16
@Vladtn: puede eliminar los círculos omitiendo plt.scatter. Puede colocar texto arbitrario en la imagen usando plt.annotate(label, xy = (x, y), xytext = (0, 0), textcoords = 'offset points'). Aviso xytext = (0, 0)significa que no hay desplazamiento, y la omisión arrowpropshace plt.annotateque no se dibuje una flecha.
unutbu
1
@OParker: Cambiar 'point{0}'.format(i)a 'point{0}'.format(i+1). O bien, puede cambiar el range: ['point{0}'.format(i) for i in range(N)]a ['point{0}'.format(i) for i in range(1,N+1)].
unutbu