¿Cómo seleccionar filas de una DataFramebase en valores en alguna columna en Python Pandas? En SQL, usaría: SELECT * FROM table WHERE colume_name = some_value Traté de mirar la documentación de los pandas pero no encontré la respuesta de
Un marco de datos es una estructura de datos tabular. Por lo general, contiene datos donde las filas son observaciones y las columnas son variables de varios tipos. Mientras "marco de datos" o "marco de datos" es el término utilizado para este concepto en varios idiomas (R, Apache Spark, deedle, Maple, la biblioteca de pandas en Python y la biblioteca de marcos de datos en Julia), "tabla" es el término utilizado en MATLAB y SQL.
¿Cómo seleccionar filas de una DataFramebase en valores en alguna columna en Python Pandas? En SQL, usaría: SELECT * FROM table WHERE colume_name = some_value Traté de mirar la documentación de los pandas pero no encontré la respuesta de
Tengo un DataFramepandas: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df Salida: c1 c2 0 10 100 1 11 110 2 12 120 Ahora quiero iterar sobre las filas de este marco. Para cada fila quiero poder acceder a sus elementos...
Tengo un DataFrame que usa pandas y etiquetas de columna que necesito editar para reemplazar las etiquetas de columna originales. Me gustaría cambiar los nombres de columna en un DataFrame Adonde están los nombres de columna originales: ['$a', '$b', '$c', '$d', '$e'] a ['a', 'b', 'c', 'd',...
Al eliminar una columna en un DataFrame que uso: del df['column_name'] Y esto funciona muy bien. ¿Por qué no puedo usar lo siguiente? del df.column_name Como es posible acceder a la columna / Serie como df.column_name, esperaba que esto
Quiero ordenar un data.frame por varias columnas. Por ejemplo, con el data.frame a continuación, me gustaría ordenar por columna z(descendente) y luego por columna b(ascendente): dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"), levels = c("Low", "Med", "Hi"), ordered = TRUE), x =...
Dados dos marcos de datos: df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3))) df2 = data.frame(CustomerId = c(2, 4, 6), State = c(rep("Alabama", 2), rep("Ohio", 1))) df1 # CustomerId Product # 1 Toaster # 2 Toaster # 3 Toaster # 4 Radio # 5 Radio # 6...
Tengo datos en diferentes columnas pero no sé cómo extraerlos para guardarlos en otra variable. index a b c 1 2 3 4 2 3 4 5 ¿Cómo selecciono 'a', 'b'y guardarlo en que gl1? Lo intenté df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] Ninguno parece
Quiero obtener una lista de los encabezados de columna de un DataFrame de pandas. El DataFrame vendrá de la entrada del usuario, así que no sabré cuántas columnas habrá o cómo se llamarán. Por ejemplo, si me dan un DataFrame como este: >>> my_dataframe y gdp cap 0 1 2 5 1 2 3 9 2 8 7...
Tengo el siguiente DataFrame indexado con columnas con nombre y filas con números no continuos: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 0.075793 -0.451460 -0.012493 Me gustaría agregar una nueva columna 'e'al marco de datos existente y no...
Estoy tratando de obtener el número de filas de dataframe df con Pandas, y aquí está mi código. Método 1: total_rows = df.count print total_rows +1 Método 2: total_rows = df['First_columnn_label'].count print total_rows +1 Ambos fragmentos de código me dan este error: TypeError: tipos de...
Tengo lo siguiente DataFrame( df): import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(10, 5)) Agrego más columnas por asignación: df['mean'] = df.mean(1) ¿Cómo puedo mover la columna meanal frente, es decir, establecerla como primera columna, dejando intacto el orden de...
Tengo varias columnas que me gustaría eliminar de un marco de datos. Sé que podemos eliminarlos individualmente usando algo como: df$x <- NULL Pero esperaba hacer esto con menos comandos. Además, sé que podría soltar columnas usando una indexación de enteros como esta: df <- df[ -c(1,...
Entiendo que los pandas están diseñados para cargar completamente poblados, DataFramepero necesito crear un DataFrame vacío y luego agregar filas, una por una . Cuál es la mejor manera de hacer esto ? Creé con éxito un DataFrame vacío con: res = DataFrame(columns=('lib', 'qty1', 'qty2')) Luego...
Me gustaría eliminar las líneas en este marco de datos que: a) contienen NAs en todas las columnas. A continuación se muestra mi marco de datos de ejemplo. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 2 2 3 ENSG00000221622 0 NA NA NA NA 4 ENSG00000207604...
Quiero convertir una tabla, representada como una lista de listas, en a Pandas DataFrame. Como un ejemplo extremadamente simplificado: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) ¿Cuál es la mejor manera de convertir las columnas a los tipos apropiados,...
Tengo esto DataFramey solo quiero los registros cuya EPScolumna no es NaN: >>> df STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231...
Tengo un marco de datos y algunas columnas tienen NAvalores. ¿Cómo reemplazo estos NAvalores con
Tengo un marco de datos en pandas que me gustaría escribir en un archivo CSV. Estoy haciendo esto usando: df.to_csv('out.csv') Y obteniendo el error: UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128) ¿Hay alguna forma de evitar esto...
Tengo una lista de diccionarios como este: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "february"}, {'points':90, 'time': '9:00', 'month': 'january'}, {'points_h1':20, 'month': 'june'}] Y quiero convertir esto en pandas DataFramecomo este: month...
Trabajo mucho con Series y DataFrames en la terminal. El valor por defecto__repr__ para una serie devuelve una muestra reducida, con algunos valores de cabeza y cola, pero falta el resto. ¿Hay alguna forma integrada de imprimir con bonitos toda la serie / marco de datos? Idealmente, sería...