¿Cómo seleccionar filas con NaN en una columna en particular?

104

Dado este marco de datos, ¿cómo seleccionar solo aquellas filas que tienen "Col2" igual a NaN?

In [56]: df = pd.DataFrame([range(3), [0, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)], columns=["Col1", "Col2", "Col3"])

In [57]: df
Out[57]: 
   0   1   2
0  0   1   2
1  0 NaN   0
2  0   0 NaN
3  0   1   2
4  0   1   2

El resultado debería ser este:

Out[57]: 
   0   1   2
1  0 NaN   0
Dinosaurio
fuente

Respuestas:

180

Intente lo siguiente:

df[df['Col2'].isnull()]
qbzenker
fuente
10
Alternativamente, df.loc[df['Col2'].isnull()]si .loc es lo tuyo
Alexander
2
P: ¿Cómo negar esto, es decir, cuando los datos de la columna "no son nulos"? R: utilizando el .notnull()operador.
sk
10

@qbzenker proporcionó el método más idiomático en mi opinión

Aquí tienes algunas alternativas:

In [28]: df.query('Col2 != Col2') # Using the fact that: np.nan != np.nan
Out[28]:
   Col1  Col2  Col3
1     0   NaN   0.0

In [29]: df[np.isnan(df.Col2)]
Out[29]:
   Col1  Col2  Col3
1     0   NaN   0.0
MaxU
fuente