¿Existe una herramienta de línea de comandos para ver / abrir archivos de Excel (.xls)?
Entonces, la respuesta funciona muy bien a menos que las hojas de trabajo no tengan un nombre personalizado.
Cuando intento abrir el archivo, obtengo:
Traceback (most recent call last):
File "/usr/bin/py_xls2csv", line 17, in <module>
for sheet_name, values in parse_xls(arg, 'cp1251'): # parse_xls(arg) -- default encoding
File "/usr/lib/python2.5/site-packages/pyExcelerator/ImportXLS.py", line 334, in parse_xls
raise Exception, 'No workbook stream in file.'
Exception: No workbook stream in file.
Sin embargo, si abro el archivo y cambio el nombre de la hoja a 'prueba' o algo, funciona bien. ¿Qué necesito ajustar para que pueda manejar los nombres predeterminados? (Hoja1, etc.)
El archivo que estoy tratando de abrir en este momento solo tiene 1 hoja, llamada Sheet1.
fuente
links -dump /tmp/tempspreadsheet.html
..... También: tal como está, imprime caracteres Unicode en\u0950
formato ... Tal vez haya alguna forma de procesar la salida para producir el carácter Unicode ... Si alguien conoce un " simple ", me gustaría verlo ...w3m
ahora (porque se ve mejor) y eso tiene algunas opciones de juego de caracteres (verw3m --help
). También he reducido la longitud, incluida la necesidad de canalizarlo a un archivo.py_xls2csv
está codificado para trabajar con la página de códigoscp1251
.. He encontrado que la sustitución de los 3 casos decp1251
lautf-8
resuelve el 'problema" de no mostrar caracteres Unicode ... supongo que depende de lo que está en el spreadsheed. pero utilizando UTF-8 funcionó para mí ... (No me di cuenta de esto hasta después de que publiqué mi respuesta, pero puede ser útil para otras conversiones)html
ha mantenido múltiples espacios, la salida representada los muestra como un solo espacio (típico de html) ... . ie ... se<td> cows moo </td>
muestra comocows moo
... Probablemente haya algún ajuste simple para esto, pero mi conocimiento de html no va mucho más allá de poder deletrear 'html' .. :)Aquí hay un método que mantiene los caracteres Unicode.
es decir. se muestra
आ
, en lugar de mostrar el valor del punto de código Unicode\U0906
El script usa OpenOffice.org y PyODConverter.py para convertir un formato de documento OOo a otro formato OOo. Los tipos de conversión se basan en las extensiones de nombre de archivo:
Probablemente haya otra forma de salir de OOo (pero no lo sé)
Y probablemente haya alguna forma de iniciar una instancia independiente de OOo también, pero tampoco sé cómo hacerlo, por lo que es, requiere que OOo no se esté ejecutando ...
fuente