¿Es posible buscar sitios de MediaWiki usando expresiones regulares?

9

Me gustaría buscar frases usando expresiones regulares en sitios como Wikipedia y Wikimedia Commons. ¿Es posible hacer esto?

Ejemplo de consulta de búsqueda de expresiones regulares: (facebook | google) (historial corporativo | sitios web)

Ya es posible hacer lo mismo en Google ( como se demuestra aquí ), por lo que quiero saber si también es posible para Wikipedia.

Anderson Green
fuente
¿Estaría dispuesto a descargar varios gigabytes de datos y hacer todo el filtrado en su propia computadora?
svick
Parece que es posible hacer esto usando AutoWikiBrowser: en.wikipedia.org/wiki/Wikipedia:AutoWikiBrowser/…
Anderson Green
Puede usar AWB para buscar una determinada página (o un conjunto de páginas), pero no toda la wiki, que suponía que era lo que quería.
svick
Sí, quería buscar en toda la wiki. ¿Hay alguna herramienta en el servidor de herramientas para esto?
Anderson Green el

Respuestas:

3

Es posible buscar en Wikipedia (o en cualquier otro sitio al que pueda acceder un motor de búsqueda) utilizando expresiones regulares simples, siempre y cuando confíe en un motor de búsqueda. La siguiente consulta de búsqueda de Google busca en Wikipedia coincidencias de la expresión regular (Yahoo|Google|Microsoft):

https://www.google.com/#hl=en&sclient=psy-ab&q=site:en.wikipedia.org+(google+OR+yahoo+OR+microsoft)&oq=site:en.wikipedia.org+(google+OR + yahoo + OR + microsoft) & gs_l = hp.3 ... 87411.96861.2.97076.26.24.2.0.0.0.79.1141.24.24.0 ... 0.0 ... 1c.1.7.psy-ab.s2oGD_2LKy4 & pbx = 1 & bav = on .2, or.r_cp.r_qf. & Bvm = bv.44158598, d.dmg & fp = dc8abc04c054405e & biw = 1366 & bih = 639

Anderson Green
fuente
2

Si solo está interesado en hacer una búsqueda de expresiones regulares de los títulos de Wikipedia , Crossword Nexus le permite hacerlo. http://crosswordnexus.com/wiki

Alex B.
fuente
2

Está disponible y funciona con CirrusSearch (basado en ElasticSearch ), que es el motor de búsqueda utilizado en los sitios de MediaWiki y la plataforma Wikimedia.

Algunos ejemplos de uso:

Nota: Referencia completa de la guía y fuente: en Wikipedia: Ayuda: Búsqueda # Search_string_syntax .

En cuanto a su pregunta:

Operadores logicos

El motor de búsqueda admite la lógica booleana en las búsquedas. Los operadores lógicos incluyen el carácter "-" (signo menos) para "no lógico", el AND, el OR y los paréntesis de agrupación: (_).

O lógico debe escribirse en mayúsculas; Se supone el operador AND para todos los términos (separados por espacios), pero el capital AND es equivalente.

Más ejemplos:

  • Simple AND, OR: "credit card" OR "payment card", "credit card" AND "payment card"- funcionará como se espera.
  • Sufijo tilde de caracteres para la búsqueda difusa ( "sonidos como") - Por ejemplo, la búsqueda de charlie~ parker~rendimientos Charlie Parker, Charles Palmer, Charley Parks(hasta dos diferencias de carácter, sin incluir la primera).
  • La búsqueda con comodines (búsqueda face*e) comienza con facey termina con una econ cualquier cosa en el medio. ingrese la descripción de la imagen aquí

Lectura extra

Lea más sobre el motor de búsqueda y esta extensión para revelar su funcionalidad y características completas.

arieljannai
fuente