Tengo un campo en un DataFrame de pandas que se importó como formato de cadena. Debería ser una variable de fecha y hora. ¿Cómo puedo convertirlo en una columna de fecha y hora y luego filtrar según la fecha?
Ejemplo:
- Nombre del marco de datos : raw_data
- Nombre de columna: Mycol
- Formato del valor en la columna: '05SEP2014: 00: 00: 00.000'
format
argumento no es obligatorio.to_datetime
es listo. Siga adelante y pruébelo sin tratar de hacer coincidir sus datos.SettingWithCopyWarning
uso de @ darth-behfans stackoverflow.com/a/42773096/4487805infer_datetime_format=True
que también podría aumentar la velocidad de análisis hasta ~ 5-10x (según los documentos de pandas) si no incluye una cadena de formato.Puede usar el método DataFrame
.apply()
para operar los valores en Mycol:fuente
Si tiene más de una columna para convertir, puede hacer lo siguiente:
fuente
funciona, sin embargo, da como resultado una advertencia de Python de que se está intentando establecer un valor en una copia de un segmento de un DataFrame. Intenta usar en su
.loc[row_indexer,col_indexer] = value
lugarSupongo que esto se debe a una indexación de encadenamiento.
fuente
Use la
to_datetime
función de pandas para analizar la columna como DateTime. Además, mediante el usoinfer_datetime_format=True
, detectará automáticamente el formato y convertirá la columna mencionada a DateTime.fuente