Iterando sobre una matriz numpy

135

¿Existe una alternativa menos detallada para esto?

for x in xrange(array.shape[0]):
    for y in xrange(array.shape[1]):
        do_stuff(x, y)

Se me ocurrió esto:

for x, y in itertools.product(map(xrange, array.shape)):
    do_stuff(x, y)

Lo que ahorra una sangría, pero sigue siendo bastante feo.

Espero algo parecido a este pseudocódigo:

for x, y in array.indices:
    do_stuff(x, y)

¿Existe algo así?

Ram Rachum
fuente
Estoy en Python 2.7 y estoy usando su solución con los itertools; Leí en los comentarios que usar itertools será más rápido. sin embargo, (tal vez porque estoy en 2.7) también tuve que descomprimir el mapa en el bucle for. for x, y in itertools.product(*map(xrange, array.shape)):
ALM
Hay una página en la Referencia de NumPy llamada "Iterating Over Arrays": docs.scipy.org/doc/numpy/reference/arrays.nditer.html
Casey
relacionado: stackoverflow.com/questions/29493183/…
Eulenfuchswiesel

Respuestas:

187

Creo que estás buscando el numeumerate .

>>> a =numpy.array([[1,2],[3,4],[5,6]])
>>> for (x,y), value in numpy.ndenumerate(a):
...  print x,y
... 
0 0
0 1
1 0
1 1
2 0
2 1

En cuanto al rendimiento. Es un poco más lento que una lista de comprensión.

X = np.zeros((100, 100, 100))

%timeit list([((i,j,k), X[i,j,k]) for i in range(X.shape[0]) for j in range(X.shape[1]) for k in range(X.shape[2])])
1 loop, best of 3: 376 ms per loop

%timeit list(np.ndenumerate(X))
1 loop, best of 3: 570 ms per loop

Si le preocupa el rendimiento, podría optimizar un poco más al observar la implementación de ndenumerate, que hace 2 cosas, convertir a una matriz y hacer un bucle. Si sabe que tiene una matriz, puede llamar al .coordsatributo del iterador plano.

a = X.flat
%timeit list([(a.coords, x) for x in a.flat])
1 loop, best of 3: 305 ms per loop
SiggyF
fuente
1
Tenga en cuenta que esto funciona pero es increíblemente lento. Es mejor iterar manualmente.
Marty
43

Si solo necesita los índices, puede intentar numpy.ndindex:

>>> a = numpy.arange(9).reshape(3, 3)
>>> [(x, y) for x, y in numpy.ndindex(a.shape)]
[(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2)]
senderle
fuente
15

ver nditer

import numpy as np
Y = np.array([3,4,5,6])
for y in np.nditer(Y, op_flags=['readwrite']):
    y += 3

Y == np.array([6, 7, 8, 9])

y = 3no funcionaría, usaría y *= 0y en su y += 3lugar.

C19
fuente
2
o use y [...] = 3
Donald Hobson