No puedo obtener el promedio o la media de una columna en pandas. A tiene un marco de datos. Ninguna de las cosas que probé a continuación me da el promedio de la columnaweight
>>> allDF
ID birthyear weight
0 619040 1962 0.1231231
1 600161 1963 0.981742
2 25602033 1963 1.3123124
3 624870 1987 0.94212
Lo siguiente devuelve varios valores, no uno:
allDF[['weight']].mean(axis=1)
Entonces esto:
allDF.groupby('weight').mean()
df.groupby('weight')
no era lo que querías, porque dividía el df en columnas separadas, cada una con un valor de peso distinto. En lugar de solodf['weight'].mean()
Respuestas:
Si solo desea la media de la
weight
columna, seleccione la columna (que es una Serie) y llame a.mean()
:fuente
Intente
df.mean(axis=0)
, elaxis=0
argumento calcula la media sabia de la columna del marco de datos, por lo que el resultado será laaxis=1
media sabia de la fila para que obtenga valores múltiples.fuente
Intenta darle
print (df.describe())
una oportunidad. Espero que sea muy útil obtener una descripción general de su marco de datos.fuente
display(df.describe())
es mejor (en Jupyter Notebooks) porquedisplay
desde ipython proporciona HTML formateado en lugar de ASCII, que es más útil / agradable visualmente.puedes usar
obtendrá estadísticas básicas del marco de datos y para obtener una columna específica puede usar
fuente
También puede acceder a una columna utilizando la notación de puntos (también llamada acceso de atributo) y luego calcular su media:
fuente
Media para cada columna en
df
:y si quieres un promedio de todas las columnas:
fuente
Además, si desea obtener el
round
valor después de encontrar elmean
.fuente
Puede usar cualquiera de las dos declaraciones a continuación:
fuente
fuente
Simplemente puede ir a: df.describe () que le proporcionará todos los detalles relevantes que necesita, pero para encontrar el valor mínimo, máximo o promedio de una columna en particular (diga 'pesos' en su caso), use:
fuente