iXBRL a XBRL? XML dentro de HTML: Excel no puede resolver

0

Tengo un montón de archivos que deberían ser una tabla con una fila y 30/40 columnas con datos, en este formato:

Inline XRBL (iXRBL - XML ​​en HTML) http://resources.companieshouse.gov.uk/toolsToHelp/pdf/inlineXBRLsample.pdf

Y los necesito poner en este formato:

XRBL (XML) http://resources.companieshouse.gov.uk/toolsToHelp/pdf/XBRLsample.pdf

(El XML en este enlace de ejemplo tiene un error y en realidad no se importará a Excel, pero se entiende la idea general).

Ya tengo algunos archivos en el formato XRBL XML y se abren en Excel y los datos van a columnas automáticamente, ideal. Se abre como unas pocas filas con 30/40 columnas con los valores en ellas.

Estoy tratando de obtener los archivos iXRBL en Excel de la misma manera, sin suerte, no se mostrará.

Necesito una interfaz por lotes para ejecutar todos los archivos iXRBL (.html) para, al menos, convertirlos en XRBL XML, lo que debería permitirme abrir en Excel y tener todos los datos en las columnas correctas. Lo ideal sería combinarlo todo en un archivo XML / XLS.

Otras ideas que tuve fue una aplicación GUI de Windows (no soy programador pero tengo una idea general) para "extraer" múltiples expresiones de todos los archivos en el directorio e importarlas automáticamente a Excel; colocando el valor del nombre de archivo EntityCurrentLegalName en la columna de la columna A y sacando todas las expresiones definidas anteriormente y su valor en las columnas B, C, D, E, etc.

Otras ideas que tenía era, digamos que hay 40 columnas, era duplicar la carpeta 40 veces y ejecutar una herramienta de búsqueda y reemplazo para eliminar todo en los archivos, excepto la expresión, por ejemplo:

Carpeta 1: "Nombre de archivo (EntityCurrentLegalName) + valor" (COLUMNA A) Carpeta 2: "CalledUpShareCapital + valor" (COLUMNA B) Carpeta 3: "NetAssetsLiabilitiesIncludingPensionAssetLiability + value" (COLUMNA C)

etc., etc. - Necesitaría usar comodines para el valor, ya que sería diferente en cada archivo y buscar en la expresión completa, es decir, eliminar todo antes y después de esa expresión ... luego combinar todos los archivos como texto y simplemente pegar cada uno columna directamente en Excel, limpiándolo todo, muy práctico para hacerlo.

(El XML en el enlace de ejemplo tiene un error y en realidad no se importará a Excel, pero se entiende la idea general).

¿Alguna idea sobre una interfaz gráfica de usuario de Windows 8 para lograr?

Publicado Otros foros

http://www.excelforum.com/excel-programming-vba-macros/1093170-ixbrl-to-xbrl-xml-inside-html-excel-cant-resolve.html#post41287811

Jade Connor
fuente
Estoy pensando en el complemento Power Query de Microsoft. Esas muestras son archivos PDF protegidos, es difícil probar cualquier idea, ya que ni siquiera puedo copiar el contenido. ¿Puede señalarnos algunos ejemplos desprotegidos?
Mike Honey
He resuelto una solución en este momento. Tengo que hacerlo a granel reemplazar usando una expresión regular a la vez. Gracias.
Jade Connor
Power Query es probablemente una solución más fácil: puede recorrer los nodos en HTML / XML y la interfaz de usuario del diseño de la consulta es aproximadamente 100 veces más fácil que la expresión regular.
Mike Honey
1
Utilicé Power query e importó el HTML, pero todos los xml / tags están por todas partes. Tal vez tendré que jugar con la consulta de poder ...
Jade Connor
resuelto? agradecería si pudiera compartir la solución ... beneficiará a otros ... ¡y a mí!
p._phidot_