Me gustaría el operador OR lógico de elementos. Sé que "o" en sí mismo no es lo que estoy buscando. Soy consciente de que y corresponde a &y NO, ~. Pero ¿qué pasa con el quirófano?
Me gustaría el operador OR lógico de elementos. Sé que "o" en sí mismo no es lo que estoy buscando. Soy consciente de que y corresponde a &y NO, ~. Pero ¿qué pasa con el quirófano?
Tengo un DataFrameobjeto Python Pandas que contiene datos textuales. Mi problema es que cuando uso la to_html()función, trunca las cadenas en la salida. Por ejemplo: import pandas df = pandas.DataFrame({'text': ['Lorem ipsum dolor sit amet, consectetur adipiscing elit.']}) print...
Cuando se usa esto en un script (no en IPython), no sucede nada, es decir, la ventana del gráfico no aparece: import numpy as np import pandas as pd ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000)) ts.plot() Incluso al agregar time.sleep(5), todavía no hay...
Cerrado . Esta pregunta se basa en opiniones . Actualmente no acepta respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que pueda responderse con hechos y citas editando esta publicación . Cerrado hace 4 años . Mejora esta...
Estoy usando marcos de datos de Pandas y quiero crear una nueva columna en función de las columnas existentes. No he visto una buena discusión sobre la diferencia de velocidad entre df.apply()y np.vectorize(), así que pensé en preguntar aquí. La apply()función Pandas es lenta. Por lo que medí...
¿Hay alguna forma de escribir una función de agregación como se usa en el DataFrame.aggmétodo, que tendría acceso a más de una columna de los datos que se están agregando? Los casos de uso típicos serían funciones de desviación estándar ponderada, promedio ponderado. Me gustaría poder escribir...
¿Hay algún método para reemplazar valores Noneen Pandas en Python? Puede usar df.replace('pre', 'post')y puede reemplazar un valor con otro, pero esto no se puede hacer si desea reemplazarlo con un Nonevalor, que si lo intenta, obtendrá un resultado extraño. Así que aquí tienes un ejemplo: df...
Limpiando los valores de un marco de datos de varios tipos en python / pandas, quiero recortar las cadenas. Actualmente lo estoy haciendo en dos instrucciones: import pandas as pd df = pd.DataFrame([[' a ', 10], [' c ', 5]]) df.replace('^\s+', '', regex=True, inplace=True)
Estoy tratando de hacer algo bastante simple, leer un archivo csv grande en un marco de datos de pandas. data = pandas.read_csv(filepath, header = 0, sep = DELIMITER,skiprows = 2) El código falla con a MemoryError, o simplemente nunca termina. El uso de memoria en el administrador de tareas...
La mayoría de las funciones de Numpy permitirán el subprocesamiento múltiple de forma predeterminada. por ejemplo, trabajo en una estación de trabajo Intel CPU de 8 núcleos, si ejecuto un script import numpy as np x=np.random.random(1000000) for i in range(100000): np.sqrt(x) Linux topmostrará...
Tengo un marco de datos y un diccionario. Necesito agregar una nueva columna al marco de datos y calcular sus valores en función del diccionario. Aprendizaje automático, agregando nuevas características basadas en alguna tabla: score = {(1, 45, 1, 1) : 4, (0, 1, 2, 1) : 5} df = pd.DataFrame(data...
Tengo un df como este: frame = pd.DataFrame({'a' : ['a,b,c', 'a,c,f', 'b,d,f','a,z,c']}) Y una lista de artículos: letters = ['a','c'] Mi objetivo es obtener todas las filas frameque contienen al menos los 2 elementos enletters Se me ocurrió esta solución: for i in letters: subframe =...
Tengo un marco de datos que registra las respuestas de la elección de lenguajes de programación de 19717 personas a través de preguntas de opción múltiple. La primera columna es, por supuesto, el género del encuestado, mientras que el resto son las opciones que eligieron. Y, por lo tanto, si elijo...
Tengo dos pandasmarcos de datos ay b: a1 a2 a3 a4 a5 a6 a7 1 3 4 5 3 4 5 0 2 0 3 0 2 1 2 5 6 5 2 1 2 y b1 b2 b3 b4 b5 b6 b7 3 5 4 5 1 4 3 0 1 2 3 0 0 2 2 2 1 5 2 6 5 Los dos marcos de datos contienen exactamente los mismos datos, pero en un orden diferente y con diferentes nombres de columna....
Estoy trabajando con filas individuales de marcos de datos de pandas, pero me encuentro con problemas de coerción al indexar e insertar filas. Parece que Pandas siempre quiere coaccionar de un tipo mixto int / float a todo tipo float, y no puedo ver ningún control obvio sobre este...
Al tener un Pandas DataFrame como este: import pandas as pd import numpy as np df = pd.DataFrame({'today': [['a', 'b', 'c'], ['a', 'b'], ['b']], 'yesterday': [['a', 'b'], ['a'], ['a']]}) today yesterday 0 ['a', 'b', 'c'] ['a', 'b'] 1 ['a', 'b'] ['a'] 2 ['b'] ['a'] ... etc Pero con alrededor...
Tengo el siguiente marco de datos de pandas: df1 = pd.DataFrame({'date': [200101,200101,200101,200101,200102,200102,200102,200102],'blockcount': [1,1,2,2,1,1,2,2],'reactiontime': [350,400,200,250,100,300,450,400]}) Estoy tratando de crear un diccionario jerárquico, con los valores del diccionario...
from itertools import product import pandas as pd df = pd.DataFrame.from_records(product(range(10), range(10))) df = df.sample(90) df.columns = "c1 c2".split() df = df.sort_values(df.columns.tolist()).reset_index(drop=True) # c1 c2 # 0 0 0 # 1 0 1 # 2 0 2 # 3 0 3 # 4 0 4 # .. .. .. # 85 9 4 # 86 9...
Tengo un gran marco de datos con muchas columnas, muchas de las cuales son de tipo datetime.datetime. El problema es que muchos también tienen tipos mixtos, que incluyen, por ejemplo, datetime.datetimevalores y Nonevalores (y potencialmente otros valores no válidos): 0 2017-07-06 00:00:00 1...
Tengo un marco de datos df, con dos columnas: Script (con texto) y Speaker Script Speaker aze Speaker 1 art Speaker 2 ghb Speaker 3 jka Speaker 1 tyc Speaker 1 avv Speaker 2 bhj Speaker 1 Y tengo la siguiente lista: L = ['a','b','c'] Con el siguiente código, df =