Estoy tratando de convertir una lista de listas que se parece a la siguiente en un marco de datos de Pandas
[['New York Yankees ', '"Acevedo Juan" ', 900000, ' Pitcher\n'],
['New York Yankees ', '"Anderson Jason"', 300000, ' Pitcher\n'],
['New York Yankees ', '"Clemens Roger" ', 10100000, ' Pitcher\n'],
['New York Yankees ', '"Contreras Jose"', 5500000, ' Pitcher\n']]
Básicamente, estoy tratando de convertir cada elemento de la matriz en un marco de datos de pandas que tiene cuatro columnas. ¿Cuál sería el mejor enfoque para esto como pd? Dataframe no me da lo que estoy buscando.
Respuestas:
fuente
DataFrame["Team"]
debe referirse al primer elemento de cada sublista (es decirdata[i][0]
) yDataFrame["Position"]
hacer referencia al último elemento de cada sublista (es decirdata[i][-1]
).columns
parámetro de DataFrame.from_records .Una vez que tenga los datos:
Puede crear un marco de datos a partir de la transposición de los datos:
De otra manera:
fuente
Puede definirlo directamente como un marco de datos de la siguiente manera:
fuente
fuente
Este fue, con mucho, el más simple:
ahora, si las claves son la primera lista en la lista de listas (datos [0]), puede asignarlas a los encabezados de columna en el marco de datos de la siguiente manera:
fuente