Me gustaría eliminar todas las filas que contienen valores NaN pertenecientes a una columna. Supongamos que tengo un conjunto de datos como este:
Age Height Weight Gender
12 5'7 NaN M
NaN 5'8 160 M
32 5'5 165 NaN
21 NaN 155 F
55 5'10 170 NaN
Quiero eliminar todas las filas donde 'Sexo' tiene valores NaN. La salida que me gustaría:
Age Height Weight Gender
12 5'7 NaN M
NaN 5'8 160 M
21 NaN 155 F
¡Gracias por adelantado!
machine-learning
python
data-cleaning
data
uharsha33
fuente
fuente
Respuestas:
Bueno, si el conjunto de datos no es demasiado grande, sugeriría usar pandas para limpiar los datos. Entonces primero tendrías que hacer
Python2
Python3
Si ya tiene instalada una anaconda, puede omitir el paso anterior. A continuación, puede pasar por un IDE (como jupyter) o mediante el shell, escriba los siguientes comandos
Entonces querrá guardar su resultado en un archivo con
fuente
Si está trabajando en Python Dataframe, intente esto.
O puede usar notnull en lugar de isfinite.
fuente