Grep Unicode para Windows [cerrado]

13

¿Hay una compatibles con Unicode grep para Windows de 32 bits?

Jeroen Wiert Pluimers
fuente
1
¿Encontraste uno que funcionara con Unicode? En las respuestas no está nada claro si las diferentes herramientas son compatibles con Unicode o no.
Peter Mortensen
1
Me di por vencido y utilicé la búsqueda integrada de Visual Studio (:
Jeroen Wiert Pluimers

Respuestas:

8

Para una herramienta de línea de comandos, mire la respuesta de KeyboardMonkey (pero no estoy seguro acerca del soporte Unicode).

Para una herramienta GUI (de código abierto): dnGREP

  • Integración de Shell (capacidad de búsqueda desde el Explorador de Windows)
  • Texto sin formato, expresión regular y búsqueda XPath (incluida la búsqueda sin distinción entre mayúsculas y minúsculas)
  • Búsqueda fonética (utilizando algoritmos Bitap y Needleman-Wunch )
  • Acciones de mover / copiar / borrar archivo
  • Buscar dentro de archivos / documentos de MS Word / documentos PDF (a través de complementos)
  • Deshacer funcionalidad
  • Integración opcional con el editor de texto (como Notepad ++ )
  • Marcadores (posibilidad de guardar búsquedas de expresiones regulares para el futuro)
  • Formulario de prueba de patrón
  • Resultados de búsqueda resaltados
  • No requiere instalación (se puede ejecutar desde una unidad USB)

ingrese la descripción de la imagen aquí

Para una herramienta GUI más simple (solo búsqueda): AstroGrep y para una más destacada (y costosa): PowerGREP

fluxtendu
fuente
Según el programa gratuito de gizmo, "Reemplazar texto" ecobyte.com/replacetext es otra opción interesante
fluxtendu
Perdón por el necro, pero ¡GRACIAS! ¡Desesperadamente esta herramienta en Windows, y este dnGREP es un regalo del cielo!
pepoluan
3

La mayoría de las versiones de Windows incluyen el comando "findtr" que funciona de manera muy similar a grep. No sé acerca de sus habilidades Unicode, pero que yo sepa no debería haber ningún problema con eso.

Morfildur
fuente
2

Actualización: GnuWin32 es un puerto mantenido más recientemente de estas herramientas. (Gracias Quack)

Aquí hay una lista de los paquetes y para descargar grep individualmente.

Eche un vistazo a UnxUtils , que también incluye grep. También los uso en mi PC de trabajo.

invertir
fuente
3
UnxUtils es antiguo y no es compatible; se actualizó por última vez en 2003. pruebe GnuWin32 para obtener un conjunto de herramientas más reciente: gnuwin32.sourceforge.net
quack
1

Sí, como menciona fluxtendu,

  • PowerGREP hará todo eso. Pero es propietario y cuesta 149 euros.
  • dnGREP también funcionará y tiene una función similar establecida de forma gratuita.

Sin embargo,

  • Cygwin también puede instalar grep (y mucho más si lo desea). Realizará la búsqueda Unicode con el -Uinterruptor. Recomendaría Cygwin como la solución más simple si está familiarizado con Unix grep. Solo asegúrese de agregar su RUTA y también puede usarla en el shell de Windows.
brice
fuente
1

La forma más sencilla de hacer esto es una utilidad de Windows llamada "cadenas" que hace exactamente lo que buscas:

Cuerdas (Sysinternals)

Básicamente, extrae todos los caracteres Unicode de los archivos, por lo que puede canalizarlos a cualquier grepalike de Windows que use, ya sea findstr(nativo) o como yo, gnuwin32 grep para Windows (hace lo que dice).

Entonces obtienes algo como:

strings *.odf | grep -i  "texttosearch"

findstr funciona también para muchas cosas, pero grep es simplemente mejor.

Algún chico
fuente
1
¿Cómo, exactamente, responde esto a la pregunta? El stringsprograma se utiliza para buscar cadenas de texto que se mezclan con datos que no son de texto ("binarios"); por ejemplo, archivos ejecutables. La pregunta no dice nada acerca de tener cadenas de texto incrustadas en datos binarios. ... ... ... ... ... ... ... ... ¿Qué sucede si quiero buscar en un archivo de texto Unicode caracteres como π y ? ¿Escribiría strings dissertation | findstr "π"? ¿ findstrManeja Unicode? Si es así, ¿por qué no decir simplemente findstr "π" dissertationqué fue sugerido hace cinco años? Si no es así, ¿qué has ganado?
G-Man dice 'Restablece a Mónica'
buen punto. Supongo que no
entendí
0

Vea BareGrep (la versión gratuita tiene una pantalla de inicio), que parece ser un grep gráfico bastante completo. La documentación menciona la compatibilidad con "Muchos formatos de archivo", por lo que me imagino que se incluye Unicode.

ingrese la descripción de la imagen aquí

harrymc
fuente
Estoy bastante seguro de que NO es compatible con Unicode. Lo probé y no funciona en archivos UTF-16. Los he enviado por correo electrónico para confirmar.
O'Rooney