Dado este marco de datos, ¿cómo seleccionar solo aquellas filas que tienen "Col2" igual a NaN
?
In [56]: df = pd.DataFrame([range(3), [0, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)], columns=["Col1", "Col2", "Col3"])
In [57]: df
Out[57]:
0 1 2
0 0 1 2
1 0 NaN 0
2 0 0 NaN
3 0 1 2
4 0 1 2
El resultado debería ser este:
Out[57]:
0 1 2
1 0 NaN 0
df.loc[df['Col2'].isnull()]
si .loc es lo tuyo.notnull()
operador.@qbzenker proporcionó el método más idiomático en mi opinión
Aquí tienes algunas alternativas:
In [28]: df.query('Col2 != Col2') # Using the fact that: np.nan != np.nan Out[28]: Col1 Col2 Col3 1 0 NaN 0.0 In [29]: df[np.isnan(df.Col2)] Out[29]: Col1 Col2 Col3 1 0 NaN 0.0
fuente