Estoy buscando una forma de filtrar las tablas que se encuentran a menudo en los artículos de Wikipedia, para poder comparar solo las filas (y columnas) que me interesan.
¿Hay alguna
- una función incorporada en el motor de Wikipedia que no conozco
- o un complemento de navegador que admita esto
Las características que puedo pensar son:
- Filtrar por valor de columna
- Ocultar columnas
- Clasificación multinivel
wikipedia
mediawiki
greasemonkey
pez globo
fuente
fuente
Respuestas:
Si coloca esta fórmula en una celda dentro de Google Sheet, eliminará los datos tabulares de este enlace del artículo de Wikipedia: http://en.wikipedia.org/wiki/Demographics_of_India
Una vez que tenga los datos dentro de Google Sheet, puede filtrar por valor de columna (seleccione el encabezado de la columna, elija Filtrar del menú Datos ) y oculte la columna (seleccione la columna, elija Ocultar columna del menú contextual)
fuente
¿Mesas? ¿Te refieres a los cuadros de información? Probablemente debería usar Wikidata http://wikidata.org/w/api.php y extraer la información de allí (será más limpia), luego presentarla como prefiera.
De lo contrario, puede rociar en
display: none
todas partes IDs y clases apropiadas para las tablas en cuestión, pero será una búsqueda interminable de información no estructurada.fuente
El script de la tabla de Wikipedia Greasemonkey hace lo que quieres:
Es posible que deba agregar la
https
versión de la URL de wikiedia a la lista de filtros de páginas incluidas en el script para que funcione.fuente