Preguntas etiquetadas con python

190
¿Cómo extraer texto de un archivo PDF?

Estoy tratando de extraer el texto incluido en este archivo PDF usando Python. Estoy usando el módulo PyPDF2 y tengo el siguiente script: import PyPDF2 pdf_file = open('sample.pdf') read_pdf = PyPDF2.PdfFileReader(pdf_file) number_of_pages = read_pdf.getNumPages() page =

188
¿Cuál es más rápido en Python: x **. 5 o math.sqrt (x)?

Me he estado preguntando esto por algún tiempo. Como dice el título, ¿cuál es más rápido, la función real o simplemente elevar a la mitad la potencia? ACTUALIZAR Esto no es una cuestión de optimización prematura. Esto es simplemente una cuestión de cómo funciona realmente el código subyacente....

188
Obtenga MD5 hash de archivos grandes en Python

He usado hashlib (que reemplaza md5 en Python 2.6 / 3.0) y funcionó bien si abrí un archivo y puse su contenido en hashlib.md5()función. El problema es con archivos muy grandes que sus tamaños podrían exceder el tamaño de RAM. ¿Cómo obtener el hash MD5 de un archivo sin cargar todo el archivo en...

188
¿Cómo unir dos generadores en Python?

Quiero cambiar el siguiente código for directory, dirs, files in os.walk(directory_1): do_something() for directory, dirs, files in os.walk(directory_2): do_something() a este código: for directory, dirs, files in os.walk(directory_1) + os.walk(directory_2): do_something() Me sale el...