Preguntas etiquetadas con dataframe

142

¿Cómo obtener la primera columna de un pandas DataFrame como una serie?

Lo intenté: x=pandas.DataFrame(...) s = x.take([0], axis=1) Y sobtiene un DataFrame, no una

142

Determinar el número de valores de NA en una columna

Quiero contar el número de NAvalores en una columna de marco de datos. Digamos que mi marco de datos se llama df, y el nombre de la columna que estoy considerando es col. La forma en que se me ocurrió es la siguiente: sapply(df$col, function(x) sum(length(which(is.na(x))))) ¿Es esta una forma...

r dataframe

142

Cambiar el nombre del índice de marco de datos de pandas

Tengo un archivo csv sin encabezado, con un índice DateTime. Quiero cambiar el nombre del índice y el nombre de la columna, pero con df.rename () solo se cambia el nombre de la columna. ¿Insecto? Estoy en la versión 0.12.0 In [2]: df = pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv',...

python pandas dataframe

140

¿Cómo reemplazar NaNs por valores anteriores en el marco de datos de pandas?

Supongamos que tengo un DataFrame con algunos NaNs: >>> import pandas as pd >>> df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]]) >>> df 0 1 2 0 1 2 3 1 4 NaN NaN 2 NaN NaN 9 Lo que necesito hacer es reemplazar cada uno NaNcon el primer no NaNvalor en la...

python python-3.x pandas dataframe nan

137

columnas de marco de datos de pandas escalando con sklearn

Tengo un marco de datos de pandas con columnas de tipo mixto, y me gustaría aplicar min_max_scaler de sklearn a algunas de las columnas. Idealmente, me gustaría hacer estas transformaciones en su lugar, pero aún no he encontrado una manera de hacerlo. He escrito el siguiente código que...

python pandas scikit-learn dataframe

137

¿Cómo guardar un data.frame en R?

Hice un data.frame en R que no es muy grande, pero lleva bastante tiempo construirlo. Me gustaría guardarlo como un archivo, que puedo abrir de nuevo en

r dataframe

137

Buscar columna cuyo nombre contiene una cadena específica

Tengo un marco de datos con nombres de columna, y quiero encontrar el que contiene una cadena determinada, pero que no coincide exactamente. Estoy buscando 'spike'en los nombres de columna como 'spike-2', 'hey spike', 'spiked-in'(la 'spike'parte es siempre continua). Quiero que el nombre de la...

python python-3.x string pandas dataframe

137

¿Cómo agregar una columna constante en un Spark DataFrame?

Quiero agregar una columna en un DataFramevalor arbitrario (que es lo mismo para cada fila). Me sale un error cuando uso de la withColumnsiguiente manera: dt.withColumn('new_column', 10).head(5) --------------------------------------------------------------------------- AttributeError Traceback...

python apache-spark dataframe pyspark apache-spark-sql

137

El marco de datos de pandas obtiene la primera fila de cada grupo

Tengo unos pandas DataFramecomo los siguientes. df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7], 'value' : ["first","second","second","first", "second","first","third","fourth", "fifth","second","fifth","first", "first","second","third","fourth","fifth"]}) Quiero agrupar esto...

python pandas dataframe

136

¿Cuál es la forma más eficiente de crear un diccionario de dos columnas de marco de datos de pandas?

¿Cuál es la forma más eficiente de organizar el siguiente marco de datos de pandas? datos = Position Letter 1 a 2 b 3 c 4 d 5 e en un diccionario como alphabet[1 : 'a', 2 : 'b', 3 : 'c', 4 : 'd', 5 :

python dictionary pandas dataframe

135

pandas: ¿Cómo divido el texto de una columna en varias filas?

Estoy trabajando con un archivo csv grande y la penúltima columna tiene una cadena de texto que quiero dividir por un delimitador específico. Me preguntaba si hay una manera simple de hacer esto usando pandas o python. CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3...

python pandas dataframe

134

pandas valores únicos columnas múltiples

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) ¿Cuál es la mejor manera de devolver los valores únicos de 'Col1' y 'Col2'? La salida deseada es 'Bob', 'Joe', 'Bill', 'Mary',

python pandas dataframe unique

133

Pandas de Python: llenar un marco de datos fila por fila

La simple tarea de agregar una fila a un pandas.DataFrameobjeto parece ser difícil de lograr. Hay 3 preguntas de stackoverflow relacionadas con esto, ninguna de las cuales da una respuesta funcional. Esto es lo que estoy tratando de hacer. Tengo un DataFrame del que ya conozco la forma, así como...

python dataframe row pandas

132

Pandas DataFrame: reemplaza todos los valores en una columna, según la condición

Tengo un DataFrame simple como el siguiente: Quiero seleccionar todos los valores de la columna 'Primera temporada' y reemplazar los que están por encima de 1990 por 1. En este ejemplo, solo Baltimore Ravens tendría el 1996 reemplazado por 1 (manteniendo el resto de los datos intactos). He...

python pandas dataframe

131

¿Cómo mostrar el nombre de todas las columnas en el marco de datos de pandas?

Tengo un marco de datos que consta de cientos de columnas y necesito ver todos los nombres de las columnas. Lo que hice: In[37]: data_all2.columns La salida es: Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa',...

python pandas dataframe show

130

Asigne múltiples columnas usando: = en data.table, por grupo

¿Cuál es la mejor manera de asignar a múltiples columnas usando data.table? Por ejemplo: f <- function(x) {c("hi", "hello")} x <- data.table(id = 1:10) Me gustaría hacer algo como esto (por supuesto, esta sintaxis es incorrecta): x[ , (col1, col2) := f(), by = "id"] Y para extender eso,...

r dataframe data.table variable-assignment colon-equals

129

¿Cómo se puede agregar una fila a un marco de datos en R?

En R, ¿cómo agrega una nueva fila a un marco de datos una vez que el marco de datos ya se ha inicializado? Hasta ahora tengo esto: df <- data.frame("hi", "bye") names(df) <- c("hello", "goodbye") #I am trying to add "hola" and "ciao" as a new row de <- data.frame("hola",...

r dataframe

129

R: ¿Concatenar dos marcos de datos?

Dados dos marcos de datos ay b: > a a b c 1 -0.2246894 -1.48167912 -1.65099363 2 0.5559320 -0.87898575 -0.15634590 3 1.8469466 -0.01487524 -0.53098215 4 -0.6875051 0.23880967 0.01824621 5 -0.6735163 0.75485292 0.44154092 > b a c 1 0.4287284 -0.3295925 2 0.5201492 0.3341251 3 -2.6355570...

r dataframe concatenation

129

Omitir filas que contienen una columna específica de NA

Quiero saber cómo omitir NAvalores en un marco de datos, pero solo en algunas columnas que me interesan. Por ejemplo, DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22)) pero solo quiero omitir los datos donde yestá NA, por lo tanto, el resultado debería ser x y z 1 1 0 NA 2...

r dataframe na

129

Eliminar partes no deseadas de cadenas en una columna

Estoy buscando una manera eficiente de eliminar partes no deseadas de las cadenas en una columna DataFrame. Los datos se ven así: time result 1 09:00 +52A 2 10:00 +62B 3 11:00 +44a 4 12:00 +30b 5 13:00 -110a Necesito recortar estos datos para: time result 1 09:00 52 2 10:00 62 3 11:00 44 4...

python string pandas dataframe