Cómo construir un objeto timedelta a partir de una cadena simple

96

Estoy escribiendo una función que necesita una entrada timedelta para pasar como una cadena. El usuario debe ingresar algo como "32m" o "2h32m", o incluso "4:13" o "5hr34m56s" ... ¿Hay alguna biblioteca o algo que ya tenga este tipo de cosas implementadas?

sacerdotec
fuente
Para las personas que sólo buscan construir un objeto timedelta de ddías, hhoras, mminutos y ssegundos utilizando una línea (después de importar datetime): datetime.timedelta(days = d, hours = h, minutes=m, seconds=s).
zthomas.nc

Respuestas:

72

Para el primer formato (5hr34m56s), debe analizar utilizando expresiones regulares

Aquí está la solución re-basada:

import re
from datetime import timedelta


regex = re.compile(r'((?P<hours>\d+?)hr)?((?P<minutes>\d+?)m)?((?P<seconds>\d+?)s)?')


def parse_time(time_str):
    parts = regex.match(time_str)
    if not parts:
        return
    parts = parts.groupdict()
    time_params = {}
    for (name, param) in parts.iteritems():
        if param:
            time_params[name] = int(param)
    return timedelta(**time_params)


>>> from parse_time import parse_time
>>> parse_time('12hr')
datetime.timedelta(0, 43200)
>>> parse_time('12hr5m10s')
datetime.timedelta(0, 43510)
>>> parse_time('12hr10s')
datetime.timedelta(0, 43210)
>>> parse_time('10s')
datetime.timedelta(0, 10)
>>> 
virhilo
fuente
4
Estaba pensando en algún tipo de función que podría tomar cualquier cosa que le arrojes y aún poder manejar la conversión a timedelta.
Priestc
2
Agregué un
4
No veo cómo dateutil.parser.parse puede analizar duraciones, parece que siempre devuelve una fecha y hora. ¿Qué me estoy perdiendo?
Nickolay
7
dateutil.parser.parseno analizará timedeltaobjetos. Devuelve un datetime, y desencadenaría una excepción para cadenas como '28:32:11.10'.
Spak
95

Para mí, la solución más elegante, sin tener que recurrir a bibliotecas externas como dateutil o analizar manualmente la entrada, es utilizar el poderoso strptimemétodo de análisis de cadenas de datetime .

from datetime import datetime, timedelta
# we specify the input and the format...
t = datetime.strptime("05:20:25","%H:%M:%S")
# ...and use datetime's hour, min and sec properties to build a timedelta
delta = timedelta(hours=t.hour, minutes=t.minute, seconds=t.second)

Después de esto, puede usar su objeto timedelta normalmente, convertirlo en segundos para asegurarse de que hicimos lo correcto, etc.

print(delta)
assert(5*60*60+20*60+25 == delta.total_seconds())
metakermit
fuente
33
Tenga en cuenta que este enfoque solo funciona si el período de tiempo es inferior a 24 horas ( datetime.strptime("32:20:25","%H:%M:%S")no funciona) y debe conocer el formato de entrada exacto.
verdesmarald
Esto también solo responde en parte a la pregunta del OP. Si la función necesita trabajar con varios formatos, aún necesita una inspección de formato adicional (¿1 dos puntos o 2?).
Danny Staple
3
@verdesmarald Entonces, a partir de Python 3.5, ¿existe una solución elegante sin usar bibliotecas externas y sin asumir que el período de tiempo es inferior a 24 horas?
máximo
1
Encuentro la necesidad de especificar manualmente los parámetros nombrados para el timedeltaparámetro bastante molesto, pero lo mejor que se me ocurre para evitar esto es:, delta = t - datetime.combine(t.date(), time.min)que es ... horrible.
Kyle Strand
2
Un problema serio con este enfoque es que si incluye días y luego envía% d a strptime, no le permitirá ingresar el día 0, ya que solo los días de> = 1 son válidos para una fecha.
user1581390
75

Ayer tenía algo de tiempo libre , así que desarrollé la respuesta de @virhilo en un módulo de Python, agregando algunos formatos de expresión de tiempo más, incluidos todos los solicitados por @priestc .

El código fuente está en github (licencia MIT) para cualquiera que lo desee. También está en PyPI:

pip install pytimeparse

Devuelve el tiempo como un número de segundos:

>>> from pytimeparse.timeparse import timeparse
>>> timeparse('32m')
1920
>>> timeparse('2h32m')
9120
>>> timeparse('4:13')
253
>>> timeparse('5hr34m56s')
20096
>>> timeparse('1.2 minutes')
72
salvaje
fuente
¿Existe un equivalente de Java / Scala?
luca.giovagnoli
¡Increíble! Muchas gracias
Bouncner
@ luca.giovagnoli En Scala puede usar la clase Duration. La duración se puede construir a partir de cadenas como '15 segundos ',' 4 minutos ', etc.
Konrad Malik
14

Quería ingresar solo una hora y luego agregarlo a varias fechas, así que esto funcionó para mí:

from datetime import datetime as dtt

time_only = dtt.strptime('15:30', "%H:%M") - dtt.strptime("00:00", "%H:%M")
kztd
fuente
dtt.strptime(myduration, "%H:%M:%S") - dtt(1900, 1, 1)también funciona ...
576i
8

He modificado la buena respuesta de virhilo con algunas actualizaciones:

  • agregó una afirmación de que la cadena es una cadena de tiempo válida
  • reemplace el indicador de hora "hr" por "h"
  • permitir un indicador de "d" días
  • permitir tiempos no enteros (p. ej., 3m0.25s3 minutos, 0,25 segundos)

.

import re
from datetime import timedelta


regex = re.compile(r'^((?P<days>[\.\d]+?)d)?((?P<hours>[\.\d]+?)h)?((?P<minutes>[\.\d]+?)m)?((?P<seconds>[\.\d]+?)s)?$')


def parse_time(time_str):
    """
    Parse a time string e.g. (2h13m) into a timedelta object.

    Modified from virhilo's answer at https://stackoverflow.com/a/4628148/851699

    :param time_str: A string identifying a duration.  (eg. 2h13m)
    :return datetime.timedelta: A datetime.timedelta object
    """
    parts = regex.match(time_str)
    assert parts is not None, "Could not parse any time information from '{}'.  Examples of valid strings: '8h', '2d8h5m20s', '2m4s'".format(time_str)
    time_params = {name: float(param) for name, param in parts.groupdict().items() if param}
    return timedelta(**time_params)
Pedro
fuente
1
¡Excelente! Agregué "*" entre los elementos para permitir también "1d 3h 5m"
Marcel Waldvogel
@MarcelWaldvogel agradable, si copia el texto de la nueva expresión regular, agregaré su respuesta en
Peter
@virhilo y Peter: Mi ligera evolución en su código está aquí: github.com/zeitgitter/zeitgitterd/blob/master/zeitgitter/… . Supongo que está bien usar su código. ¿Tiene alguna preferencia por la licencia? MIT, Apache, GPL,…?
Marcel Waldvogel
1
Marcel, ¿puedes enviarme tu dirección para que pueda demandar? JK adelante, cualquier licencia está bien.
Peter
Aquí está el nuevo Regex; la diferencia es la "*" s: regex = re.compile (r '^ ((? P <días> [\. \ d] +?) d)? *' r '((? P <horas> [\ . \ d] +?) h)? * 'r' ((? P <minutos> [\. \ d] +?) m)? * 'r' ((? P <segundos> [\. \ d] +?) s)? $ ')
Marcel Waldvogel
3

Si usa Python 3, aquí está la versión actualizada para la solución de Hari Shankar, que usé:

from datetime import timedelta
import re

regex = re.compile(r'(?P<hours>\d+?)/'
                   r'(?P<minutes>\d+?)/'
                   r'(?P<seconds>\d+?)$')

def parse_time(time_str):
    parts = regex.match(time_str)
    if not parts:
        return
    parts = parts.groupdict()
    print(parts)
    time_params = {}
    for name, param in parts.items():
        if param:
            time_params[name] = int(param)
    return timedelta(**time_params)
Alexey Kislitsin
fuente
3

Django viene con la función de utilidad parse_duration(). De la documentación :

Analiza una cadena y devuelve un datetime.timedelta.

Espera datos en el formato "DD HH:MM:SS.uuuuuu"o según lo especificado por ISO 8601 (por ejemplo, P4DT1H15M20Sque es equivalente a 4 1:15:20) o el formato de intervalo de tiempo de día de PostgreSQL (por ejemplo 3 days 04:05:06).

Don Kirkby
fuente