¿Existe una herramienta de línea de comandos para ver / abrir archivos de Excel (.xls)?
Entonces, la respuesta funciona muy bien a menos que las hojas de trabajo no tengan un nombre personalizado.
Cuando intento abrir el archivo, obtengo:
Traceback (most recent call last):
  File "/usr/bin/py_xls2csv", line 17, in <module>
    for sheet_name, values in parse_xls(arg, 'cp1251'): # parse_xls(arg) -- default encoding
  File "/usr/lib/python2.5/site-packages/pyExcelerator/ImportXLS.py", line 334, in parse_xls
    raise Exception, 'No workbook stream in file.'
Exception: No workbook stream in file.
Sin embargo, si abro el archivo y cambio el nombre de la hoja a 'prueba' o algo, funciona bien. ¿Qué necesito ajustar para que pueda manejar los nombres predeterminados? (Hoja1, etc.)
El archivo que estoy tratando de abrir en este momento solo tiene 1 hoja, llamada Sheet1.
fuente

links -dump /tmp/tempspreadsheet.html..... También: tal como está, imprime caracteres Unicode en\u0950formato ... Tal vez haya alguna forma de procesar la salida para producir el carácter Unicode ... Si alguien conoce un " simple ", me gustaría verlo ...w3mahora (porque se ve mejor) y eso tiene algunas opciones de juego de caracteres (verw3m --help). También he reducido la longitud, incluida la necesidad de canalizarlo a un archivo.py_xls2csvestá codificado para trabajar con la página de códigoscp1251.. He encontrado que la sustitución de los 3 casos decp1251lautf-8resuelve el 'problema" de no mostrar caracteres Unicode ... supongo que depende de lo que está en el spreadsheed. pero utilizando UTF-8 funcionó para mí ... (No me di cuenta de esto hasta después de que publiqué mi respuesta, pero puede ser útil para otras conversiones)htmlha mantenido múltiples espacios, la salida representada los muestra como un solo espacio (típico de html) ... . ie ... se<td> cows moo </td>muestra comocows moo... Probablemente haya algún ajuste simple para esto, pero mi conocimiento de html no va mucho más allá de poder deletrear 'html' .. :)Aquí hay un método que mantiene los caracteres Unicode.
es decir. se muestra
आ, en lugar de mostrar el valor del punto de código Unicode\U0906El script usa OpenOffice.org y PyODConverter.py para convertir un formato de documento OOo a otro formato OOo. Los tipos de conversión se basan en las extensiones de nombre de archivo:
Probablemente haya otra forma de salir de OOo (pero no lo sé)
Y probablemente haya alguna forma de iniciar una instancia independiente de OOo también, pero tampoco sé cómo hacerlo, por lo que es, requiere que OOo no se esté ejecutando ...
fuente