Lo intenté: x=pandas.DataFrame(...) s = x.take([0], axis=1) Y sobtiene un DataFrame, no una
Lo intenté: x=pandas.DataFrame(...) s = x.take([0], axis=1) Y sobtiene un DataFrame, no una
Quiero contar el número de NAvalores en una columna de marco de datos. Digamos que mi marco de datos se llama df, y el nombre de la columna que estoy considerando es col. La forma en que se me ocurrió es la siguiente: sapply(df$col, function(x) sum(length(which(is.na(x))))) ¿Es esta una forma...
Tengo un archivo csv sin encabezado, con un índice DateTime. Quiero cambiar el nombre del índice y el nombre de la columna, pero con df.rename () solo se cambia el nombre de la columna. ¿Insecto? Estoy en la versión 0.12.0 In [2]: df = pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv',...
Supongamos que tengo un DataFrame con algunos NaNs: >>> import pandas as pd >>> df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]]) >>> df 0 1 2 0 1 2 3 1 4 NaN NaN 2 NaN NaN 9 Lo que necesito hacer es reemplazar cada uno NaNcon el primer no NaNvalor en la...
Tengo un marco de datos de pandas con columnas de tipo mixto, y me gustaría aplicar min_max_scaler de sklearn a algunas de las columnas. Idealmente, me gustaría hacer estas transformaciones en su lugar, pero aún no he encontrado una manera de hacerlo. He escrito el siguiente código que...
Hice un data.frame en R que no es muy grande, pero lleva bastante tiempo construirlo. Me gustaría guardarlo como un archivo, que puedo abrir de nuevo en
Tengo un marco de datos con nombres de columna, y quiero encontrar el que contiene una cadena determinada, pero que no coincide exactamente. Estoy buscando 'spike'en los nombres de columna como 'spike-2', 'hey spike', 'spiked-in'(la 'spike'parte es siempre continua). Quiero que el nombre de la...
Quiero agregar una columna en un DataFramevalor arbitrario (que es lo mismo para cada fila). Me sale un error cuando uso de la withColumnsiguiente manera: dt.withColumn('new_column', 10).head(5) --------------------------------------------------------------------------- AttributeError Traceback...
Tengo unos pandas DataFramecomo los siguientes. df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7], 'value' : ["first","second","second","first", "second","first","third","fourth", "fifth","second","fifth","first", "first","second","third","fourth","fifth"]}) Quiero agrupar esto...
¿Cuál es la forma más eficiente de organizar el siguiente marco de datos de pandas? datos = Position Letter 1 a 2 b 3 c 4 d 5 e en un diccionario como alphabet[1 : 'a', 2 : 'b', 3 : 'c', 4 : 'd', 5 :
Estoy trabajando con un archivo csv grande y la penúltima columna tiene una cadena de texto que quiero dividir por un delimitador específico. Me preguntaba si hay una manera simple de hacer esto usando pandas o python. CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3...
df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) ¿Cuál es la mejor manera de devolver los valores únicos de 'Col1' y 'Col2'? La salida deseada es 'Bob', 'Joe', 'Bill', 'Mary',
La simple tarea de agregar una fila a un pandas.DataFrameobjeto parece ser difícil de lograr. Hay 3 preguntas de stackoverflow relacionadas con esto, ninguna de las cuales da una respuesta funcional. Esto es lo que estoy tratando de hacer. Tengo un DataFrame del que ya conozco la forma, así como...
Tengo un DataFrame simple como el siguiente: Quiero seleccionar todos los valores de la columna 'Primera temporada' y reemplazar los que están por encima de 1990 por 1. En este ejemplo, solo Baltimore Ravens tendría el 1996 reemplazado por 1 (manteniendo el resto de los datos intactos). He...
Tengo un marco de datos que consta de cientos de columnas y necesito ver todos los nombres de las columnas. Lo que hice: In[37]: data_all2.columns La salida es: Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa',...
¿Cuál es la mejor manera de asignar a múltiples columnas usando data.table? Por ejemplo: f <- function(x) {c("hi", "hello")} x <- data.table(id = 1:10) Me gustaría hacer algo como esto (por supuesto, esta sintaxis es incorrecta): x[ , (col1, col2) := f(), by = "id"] Y para extender eso,...
En R, ¿cómo agrega una nueva fila a un marco de datos una vez que el marco de datos ya se ha inicializado? Hasta ahora tengo esto: df <- data.frame("hi", "bye") names(df) <- c("hello", "goodbye") #I am trying to add "hola" and "ciao" as a new row de <- data.frame("hola",...
Dados dos marcos de datos ay b: > a a b c 1 -0.2246894 -1.48167912 -1.65099363 2 0.5559320 -0.87898575 -0.15634590 3 1.8469466 -0.01487524 -0.53098215 4 -0.6875051 0.23880967 0.01824621 5 -0.6735163 0.75485292 0.44154092 > b a c 1 0.4287284 -0.3295925 2 0.5201492 0.3341251 3 -2.6355570...
Quiero saber cómo omitir NAvalores en un marco de datos, pero solo en algunas columnas que me interesan. Por ejemplo, DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22)) pero solo quiero omitir los datos donde yestá NA, por lo tanto, el resultado debería ser x y z 1 1 0 NA 2...
Estoy buscando una manera eficiente de eliminar partes no deseadas de las cadenas en una columna DataFrame. Los datos se ven así: time result 1 09:00 +52A 2 10:00 +62B 3 11:00 +44a 4 12:00 +30b 5 13:00 -110a Necesito recortar estos datos para: time result 1 09:00 52 2 10:00 62 3 11:00 44 4...