El comando FINDSTR de Windows está horriblemente documentado. Hay ayuda de línea de comandos muy básica disponible a través de FINDSTR /?
, o HELP FINDSTR
, pero es lamentablemente inadecuada. Hay un poquito más de documentación en línea en https://docs.microsoft.com/en-us/windows-server/administration/windows-commands/findstr .
Hay muchas características y limitaciones de FINDSTR que ni siquiera se mencionan en la documentación. Tampoco podrían anticiparse sin conocimiento previo y / o experimentación cuidadosa.
Entonces la pregunta es: ¿cuáles son las características y limitaciones de FINDSTR no documentadas?
El propósito de esta pregunta es proporcionar un repositorio único de las muchas características no documentadas para que:
A) Los desarrolladores pueden aprovechar al máximo las características que están allí.
B) Los desarrolladores no pierden el tiempo preguntándose por qué algo no funciona cuando parece que debería funcionar.
Asegúrese de conocer la documentación existente antes de responder. Si la información está cubierta por la AYUDA, entonces no pertenece aquí.
Tampoco es este un lugar para mostrar usos interesantes de FINDSTR. Si una persona lógica podría anticipar el comportamiento de un uso particular de FINDSTR basado en la documentación, entonces no pertenece aquí.
En la misma línea, si una persona lógica pudiera anticipar el comportamiento de un uso particular basado en la información contenida en las respuestas existentes, entonces, nuevamente, no pertenece aquí.
fuente
grep
que se entiende y documenta muy bien :-) Ver stackoverflow.com/questions/2635740/… por ejemplo.Respuestas:
Prefacio
Gran parte de la información de esta respuesta se ha recopilado en base a experimentos realizados en una máquina Vista. A menos que se indique explícitamente lo contrario, no he confirmado si la información se aplica a otras versiones de Windows.
Salida FINDSTR
La documentación nunca se molesta en explicar la salida de FINDSTR. Alude al hecho de que se imprimen líneas coincidentes, pero nada más.
El formato de salida de línea coincidente es el siguiente:
filename: lineNumber: lineOffset: text
dónde
nombre del archivo: = El nombre del archivo que contiene la línea coincidente. El nombre del archivo no se imprime si la solicitud fue explícitamente para un solo archivo, o si se busca una entrada canalizada o una entrada redirigida. Cuando se imprime, el nombre del archivo siempre incluirá cualquier información de ruta proporcionada. Se agregará información de ruta adicional si
/S
se utiliza la opción. La ruta impresa siempre es relativa a la ruta proporcionada, o relativa al directorio actual si no se proporciona ninguno.Nota - El prefijo de nombre de archivo se puede evitar cuando se busca varios archivos mediante el uso de la no-estándar (y mal documentados) comodines
<
y>
. Las reglas exactas sobre cómo funcionan estos comodines se pueden encontrar aquí . Finalmente, puede ver este ejemplo de cómo funcionan los comodines no estándar con FINDSTR .lineNumber: = El número de línea de la línea coincidente representada como un valor decimal con 1 que representa la primera línea de la entrada. Solo se imprime si
/N
se especifica la opción.lineOffset: = El desplazamiento del byte decimal del inicio de la línea coincidente, donde 0 representa el primer carácter de la primera línea. Solo se imprime si
/O
se especifica la opción. Este no esel desplazamiento de la coincidencia dentro de la línea. Es el número de bytes desde el comienzo del archivo hasta el comienzo de la línea.text = La representación binaria de la línea coincidente, incluidos <CR> y / o <LF>. No queda nada fuera de la salida binaria, de modo que este ejemplo que coincida con todas las líneas producirá una copia binaria exacta del archivo original.
La opción / A establece el color del fileName :, lineNumber :, y lineOffset: solo salida. El texto de la línea coincidente siempre sale con el color de la consola actual. La opción / A solo tiene efecto cuando la salida se muestra directamente en la consola. La opción / A no tiene efecto si la salida se redirige a un archivo o se canaliza. Consulte la edición de 2018-08-18 en la respuesta de Aacini para obtener una descripción del comportamiento defectuoso cuando la salida se redirige a CON.
La mayoría de los caracteres de control y muchos caracteres ASCII extendidos se muestran como puntos en XP
FINDSTR en XP muestra la mayoría de los caracteres de control no imprimibles de líneas coincidentes como puntos (puntos) en la pantalla. Los siguientes caracteres de control son excepciones; se muestran como ellos mismos: 0x09 Tabulación, 0x0A LineFeed, 0x0B Vertical Tab, 0x0C Form Feed, 0x0D Carriage Return.
XP FINDSTR también convierte una cantidad de caracteres ASCII extendidos en puntos también. Los caracteres ASCII extendidos que se muestran como puntos en XP son los mismos que se transforman cuando se proporcionan en la línea de comandos. Consulte la sección "Límites de caracteres para los parámetros de la línea de comandos: transformación ASCII extendida" , más adelante en esta publicación
Los caracteres de control y ASCII extendido no se convierten en puntos en XP si la salida se canaliza, se redirige a un archivo o dentro de una cláusula FOR IN ().
Vista y Windows 7 siempre muestran todos los caracteres como ellos mismos, nunca como puntos.
Códigos de retorno (ERRORLEVEL)
/A:xx
opción/L
y/R
ambas especificadas/A:
,/F:
,/C:
,/D:
, o/G:
/F:file
o/G:file
no encontradover Límite de término de clase de caracteres Regex y ERROR en la parte 2 de la respuesta
Fuente de datos para buscar (actualizado en base a pruebas con Windows 7)
Findstr puede buscar datos de solo una de las siguientes fuentes:
nombres de archivo especificados como argumentos y / o utilizando la
/F:file
opciónstdin a través de la redirección
findstr "searchString" <file
flujo de datos desde una tubería
type file | findstr "searchString"
Los argumentos / opciones tienen prioridad sobre la redirección, que tiene prioridad sobre los datos canalizados.
Argumentos de nombre de archivo y
/F:file
se pueden combinar. Se pueden usar múltiples argumentos de nombre de archivo. Si/F:file
se especifican varias opciones, solo se usa la última. Los comodines están permitidos en los argumentos de nombre de archivo, pero no dentro del archivo señalado por/F:file
.Fuente de las cadenas de búsqueda (actualizado basado en pruebas con Windows 7)
Las opciones
/G:file
y/C:string
pueden combinarse. Se/C:string
pueden especificar múltiples opciones. Si/G:file
se especifican varias opciones, solo se usa la última. Si se usa/G:file
o/C:string
, se supone que todos los argumentos que no son opciones son archivos para buscar. Si no se utiliza ni/G:file
tampoco/C:string
, entonces el primer argumento sin opción se trata como una lista delimitada por espacios de términos de búsqueda.Los nombres de archivo no se deben citar dentro del archivo cuando se usa la
/F:FILE
opción.Los nombres de archivo pueden contener espacios y otros caracteres especiales. La mayoría de los comandos requieren que se citen dichos nombres de archivo. Pero la
/F:files.txt
opción FINDSTR requiere que los nombres de archivo dentro de files.txt NO se deben citar. El archivo no se encontrará si se cita el nombre.ERROR: los nombres cortos de archivo 8.3 pueden romper las opciones
/D
y/S
Al igual que con todos los comandos de Windows, FINDSTR intentará hacer coincidir tanto el nombre largo como el nombre corto 8.3 al buscar archivos para buscar. Suponga que la carpeta actual contiene los siguientes archivos no vacíos:
El siguiente comando encontrará con éxito los 3 archivos:
b.txt2
coincide porque coincide el nombre corto correspondienteB9F64~1.TXT
. Esto es coherente con el comportamiento de todos los demás comandos de Windows.Pero un error con las opciones
/D
y/S
hace que los siguientes comandos solo encuentrenb1.txt
El error evita que
b.txt2
se encuentren, así como todos los nombres de archivo que se ordenan despuésb.txt2
dentro del mismo directorio. Se encuentran archivos adicionales que se ordenan antes, comoa.txt
. Los archivos adicionales que se ordenan más tarde, comod.txt
, se pierden una vez que se ha activado el error.Cada directorio buscado se trata de forma independiente. Por ejemplo, la
/S
opción comenzaría a buscar con éxito en una carpeta secundaria después de no encontrar archivos en el padre, pero una vez que el error hace que se pierda un nombre de archivo corto en el niño, también se perderán todos los archivos posteriores en esa carpeta secundaria. .Los comandos funcionan sin errores si se crean los mismos nombres de archivo en una máquina que tiene la generación de nombres NTFS 8.3 deshabilitada. Por supuesto
b.txt2
, no se encontraría, peroc.txt
se encontraría correctamente.No todos los nombres cortos activan el error. Todas las instancias de comportamiento con errores que he visto involucran una extensión que tiene más de 3 caracteres con un nombre corto de 8.3 que comienza igual que un nombre normal que no requiere un nombre de 8.3.
El error ha sido confirmado en XP, Vista y Windows 7.
Caracteres no imprimibles y la
/P
opciónLa
/P
opción hace que FINDSTR omita cualquier archivo que contenga cualquiera de los siguientes códigos de bytes decimales:0-7, 14-25, 27-31.
Dicho de otra manera, la
/P
opción solo omitirá los archivos que contengan caracteres de control no imprimibles. Los caracteres de control son códigos menores o iguales a 31 (0x1F). FINDSTR trata los siguientes caracteres de control como imprimibles:Todos los demás caracteres de control se tratan como no imprimibles, cuya presencia hace que la
/P
opción omita el archivo.<CR><LF>
La entrada canalizada y redirigida puede haberse agregado Si la entrada está canalizada y el último carácter de la secuencia no
<LF>
, FINDSTR se agregará automáticamente<CR><LF>
a la entrada. Esto se ha confirmado en XP, Vista y Windows 7. (Solía pensar que la tubería de Windows era responsable de modificar la entrada, pero desde entonces descubrí que FINDSTR realmente está haciendo la modificación).Lo mismo es cierto para la entrada redirigida en Vista. Si el último carácter de un archivo utilizado como entrada redirigida no lo es
<LF>
, FINDSTR se agregará automáticamente<CR><LF>
a la entrada. Sin embargo, XP y Windows 7 no alteran la entrada redirigida.FINDSTR se bloquea en XP y Windows 7 si la entrada redirigida no termina con
<LF>
Esta es una "característica" desagradable en XP y Windows 7. Si el último carácter de un archivo utilizado como entrada redirigida no termina
<LF>
, FINDSTR se bloqueará indefinidamente una vez que llega al final del archivo redirigido.La última línea de datos
canalizados puede ignorarse si consta de un solo carácter Si la entrada se canaliza y la última línea consta de un único carácter al que no sigue
<LF>
, FINDSTR ignora por completo la última línea.Ejemplo: el primer comando con un solo carácter y ninguno
<LF>
no coincide, pero el segundo comando con 2 caracteres funciona bien, al igual que el tercer comando que tiene un carácter con nueva línea de terminación.Reportado por el usuario de DosTips Sponge Belly en el nuevo error de findtr . Confirmado en XP, Windows 7 y Windows 8. Todavía no he oído hablar de Vista. (Ya no tengo Vista para probar).
Sintaxis de la opción Las
opciones se pueden prefijar con
/
o las-
opciones se pueden concatenar después de una sola/
o-
. Sin embargo, la lista de opciones concatenadas puede contener como máximo una opción de caracteres múltiples como OFF o F :, y la opción de caracteres múltiples debe ser la última opción en la lista.Las siguientes son formas equivalentes de expresar una búsqueda de expresiones regulares sin distinción entre mayúsculas y minúsculas para cualquier línea que contenga "hola" y "adiós" en cualquier orden
/i /r /c:"hello.*goodbye" /c:"goodbye.*hello"
-i -r -c:"hello.*goodbye" /c:"goodbye.*hello"
/irc:"hello.*goodbye" /c:"goodbye.*hello"
Límites de longitud de la cadena de búsqueda
En Vista, la longitud máxima permitida para una sola cadena de búsqueda es de 511 bytes. Si alguna cadena de búsqueda supera 511, el resultado es un
FINDSTR: Search string too long.
error con ERRORLEVEL 2.Al realizar una búsqueda de expresión regular, la longitud máxima de la cadena de búsqueda es 254. Una expresión regular con una longitud entre 255 y 511 dará como resultado un
FINDSTR: Out of memory
error con ERRORLEVEL 2. Una longitud de expresión regular> 511 produce elFINDSTR: Search string too long.
error.En Windows XP, la longitud de la cadena de búsqueda es aparentemente más corta. Error Findstr: "Cadena de búsqueda demasiado larga": ¿Cómo extraer y hacer coincidir la subcadena en el bucle "for"? El límite de XP es de 127 bytes para búsquedas literales y expresiones regulares.
Límites de longitud de línea Los
archivos especificados como argumento de línea de comando o mediante la opción / F: FILE no tienen límite de longitud de línea conocido. Las búsquedas se ejecutaron correctamente en un archivo de 128 MB que no contenía un solo <LF>.
Los datos canalizados y la entrada redirigida están limitados a 8191 bytes por línea. Este límite es una "característica" de FINDSTR. No es inherente a las tuberías ni a la redirección. FINDSTR usando stdin redirigido o entrada canalizada nunca coincidirá con ninguna línea que sea> = 8k bytes. Las líneas> = 8k generan un mensaje de error para stderr, pero ERRORLEVEL sigue siendo 0 si la cadena de búsqueda se encuentra en al menos una línea de al menos un archivo.
Tipo de búsqueda predeterminado: Literal vs Expresión regular
/C:"string"
: el valor predeterminado es / L literal. Combinar explícitamente la opción / L con / C: "string" ciertamente funciona pero es redundante."string argument"
- El valor predeterminado depende del contenido de la primera cadena de búsqueda. (Recuerde que <space> se usa para delimitar las cadenas de búsqueda). Si la primera cadena de búsqueda es una expresión regular válida que contiene al menos un metacarácter sin escape, todas las cadenas de búsqueda se tratan como expresiones regulares. De lo contrario, todas las cadenas de búsqueda se tratan como literales. Por ejemplo,"51.4 200"
se tratará como dos expresiones regulares porque la primera cadena contiene un punto sin escape, mientras"200 51.4"
que se tratará como dos literales porque la primera cadena no contiene metacaracteres./G:file
- El valor predeterminado depende del contenido de la primera línea no vacía en el archivo. Si la primera cadena de búsqueda es una expresión regular válida que contiene al menos un meta-carácter sin escape, entonces todas las cadenas de búsqueda se tratan como expresiones regulares. De lo contrario, todas las cadenas de búsqueda se tratan como literales.Recomendación: siempre especifique explícitamente
/L
la opción literal o/R
la opción de expresión regular cuando use"string argument"
o/G:file
.ERROR: especificar varias cadenas de búsqueda literales puede dar resultados poco confiables
El siguiente ejemplo FINDSTR simple no puede encontrar una coincidencia, aunque debería.
Este error ha sido confirmado en Windows Server 2003, Windows XP, Vista y Windows 7.
Según los experimentos, FINDSTR puede fallar si se cumplen todas las condiciones siguientes:
/I
opción)En cada falla que he visto, siempre es una de las cadenas de búsqueda más cortas que falla.
Para obtener más información, consulte ¿Por qué este ejemplo FINDSTR con múltiples cadenas de búsqueda literales no encuentra una coincidencia?
Cita y barra
invertida de escape dentro de / G: cadenas de búsqueda literal de ARCHIVO Las comillas y las barras invertidas independientes dentro de un archivo de cadena de búsqueda literal especificado por / G: archivo no necesitan escapar, pero pueden serlo.
"
y\"
son equivalentes\
y\\
son equivalentesSi la intención es encontrar \\, entonces se debe escapar al menos la barra diagonal inversa inicial. Ambos
\\\
y\\\\
trabajo.Si la intención es encontrar \", entonces por lo menos debe ser escapado de la barra invertida inicial. Tanto
\\"
y\\\"
trabajo.Cita de escape y barra invertida dentro de / G: cadenas de búsqueda de expresiones regulares de ARCHIVO
Este es el caso en el que las secuencias de escape funcionan según lo esperado según la documentación. La cita no es un metacarácter regex, por lo que no necesita ser escapado (pero puede serlo). La barra invertida es un metacarácter regex, por lo que debe escaparse.
Límites de caracteres para los parámetros de la línea de comandos: transformación ASCII extendida
El carácter nulo (0x00) no puede aparecer en ninguna cadena en la línea de comandos. Cualquier otro carácter de un solo byte puede aparecer en la cadena (0x01 - 0xFF). Sin embargo, FINDSTR convierte muchos caracteres ASCII extendidos que encuentra dentro de los parámetros de la línea de comandos en otros caracteres. Esto tiene un gran impacto de dos maneras:
1) Muchos caracteres ASCII extendidos no coincidirán si se usan como una cadena de búsqueda en la línea de comando. Esta limitación es la misma para búsquedas literales y expresiones regulares. Si una cadena de búsqueda debe contener ASCII extendido, entonces se
/G:FILE
debe usar la opción en su lugar.2) FINDSTR puede no encontrar un archivo si el nombre contiene caracteres ASCII extendidos y el nombre del archivo se especifica en la línea de comando. Si un archivo para buscar contiene ASCII extendido en el nombre, entonces se
/F:FILE
debe usar la opción en su lugar.Aquí hay una lista completa de transformaciones de caracteres ASCII extendidas que FINDSTR realiza en cadenas de línea de comandos. Cada carácter se representa como el valor del código de byte decimal. El primer código representa el carácter tal como se proporciona en la línea de comando, y el segundo código representa el carácter en el que se transforma. Nota: esta lista se compiló en una máquina estadounidense. No sé qué impacto pueden tener otros idiomas en esta lista.
Cualquier carácter> 0 que no esté en la lista anterior se trata como sí mismo, incluidos
<CR>
y <LF>
. La forma más fácil de incluir caracteres impares como<CR>
y<LF>
es colocarlos en una variable de entorno y usar la expansión retrasada dentro del argumento de la línea de comandos.Límites de caracteres para las cadenas que se encuentran en los archivos especificados por las opciones / G: FILE y / F: FILE
El carácter nul (0x00) puede aparecer en el archivo, pero funciona como el terminador de cadena C. Cualquier carácter después de un carácter nulo se trata como una cadena diferente como si estuviera en otra línea.
Los caracteres
<CR>
y<LF>
se tratan como terminadores de línea que terminan una cadena, y no se incluyen en la cadena.Todos los demás caracteres de un solo byte se incluyen perfectamente dentro de una cadena.
Búsqueda de archivos Unicode
FINDSTR no puede buscar correctamente la mayoría de Unicode (UTF-16, UTF-16LE, UTF-16BE, UTF-32) porque no puede buscar bytes nul y Unicode generalmente contiene muchos bytes nul.
Sin embargo, el comando TYPE convierte UTF-16LE con BOM en un conjunto de caracteres de un solo byte, por lo que un comando como el siguiente funcionará con UTF-16LE con BOM.
Tenga en cuenta que los puntos de código Unicode que no son compatibles con su página de códigos activa se convertirán en
?
caracteres.Es posible buscar UTF-8 siempre que su cadena de búsqueda contenga solo ASCII. Sin embargo, la salida de la consola de cualquier carácter UTF-8 de varios bytes no será correcta. Pero si redirige la salida a un archivo, el resultado se codificará correctamente UTF-8. Tenga en cuenta que si el archivo UTF-8 contiene una lista de materiales, entonces la lista de materiales se considerará como parte de la primera línea, lo que podría descartar una búsqueda que coincida con el comienzo de una línea.
Es posible buscar caracteres UTF-8 de varios bytes si coloca su cadena de búsqueda en un archivo de búsqueda codificado UTF-8 (sin BOM) y utiliza la opción / G.
Fin de la línea
FINDSTR rompe las líneas inmediatamente después de cada <LF>. La presencia o ausencia de <CR> no tiene impacto en los saltos de línea.
Buscar en saltos de línea
Como se esperaba, el
.
metacarácter regex no coincidirá con <CR> o <LF>. Pero es posible buscar a través de un salto de línea usando una cadena de búsqueda de línea de comando. Tanto los caracteres <CR> como <LF> deben coincidir explícitamente. Si se encuentra una coincidencia de varias líneas, solo se imprime la primera línea de la coincidencia. FINDSTR luego vuelve a la segunda línea de la fuente y comienza la búsqueda nuevamente, una especie de función de "mirar hacia adelante".Suponga que TEXT.TXT tiene estos contenidos (podría ser estilo Unix o Windows)
Entonces este guión
da estos resultados
La búsqueda en saltos de línea con la opción / G: FILE es imprecisa porque la única forma de hacer coincidir <CR> o <LF> es a través de una expresión de rango de clase de caracteres regex que emparede los caracteres EOL.
[<TAB>-<0x0B>]
coincide con <LF>, pero también coincide con <TAB> y <0x0B>[<0x0C>-!]
coincide con <CR>, pero también coincide con <0x0C> y!Nota: lo anterior son representaciones simbólicas del flujo de bytes regex ya que no puedo representar gráficamente los caracteres.
La respuesta continuó en la parte 2 a continuación ...
fuente
addpath.bat
de Q141344 y findstr, que puede estar relacionado con el problema que cuelga Win7 mencionado anteriormente. He creado una sala de chat para tratar de rastrear esto, para cualquiera que esté interesado: chat.stackoverflow.com/rooms/13177/…/S
y/D
opciones derivadas de nombres cortos de archivos 8.3.<LF>
La respuesta continúa de la parte 1 anterior : me he encontrado con el límite de respuesta de 30,000 caracteres :-(
Compatibilidad con expresiones regulares limitadas (expresiones regulares) La compatibilidad con
FINDSTR para expresiones regulares es extremadamente limitada. Si no está en la documentación de AYUDA, no es compatible.
Más allá de eso, las expresiones de expresiones regulares que se admiten se implementan de una manera completamente no estándar, de modo que los resultados pueden ser diferentes de lo que cabría esperar de algo como grep o perl.
La posición de línea de expresión fija ancla ^ y $
^
coincide con el comienzo del flujo de entrada, así como con cualquier posición que siga inmediatamente a un <LF>. Como FINDSTR también rompe líneas después de <LF>, una expresión regular simple de "^" siempre coincidirá con todas las líneas dentro de un archivo, incluso un archivo binario.$
coincide con cualquier posición inmediatamente anterior a un <CR>. Esto significa que una cadena de búsqueda regex que contenga$
nunca coincidirá con ninguna línea dentro de un archivo de texto de estilo Unix, ni coincidirá con la última línea de un archivo de texto de Windows si le falta el marcador EOL de <CR> <LF>.Nota: Como se discutió anteriormente, la entrada canalizada y redirigida a FINDSTR puede haber
<CR><LF>
agregado que no está en la fuente. Obviamente, esto puede afectar una búsqueda de expresiones regulares que utiliza$
.Cualquier cadena de búsqueda con caracteres antes
^
o después$
siempre fallará en encontrar una coincidencia.Opciones posicionales / B / E / X
Las opciones posicionales funcionan igual que
^
y$
, excepto que también funcionan para cadenas de búsqueda literales./ B funciona igual que
^
al comienzo de una cadena de búsqueda de expresiones regulares./ E funciona igual que
$
al final de una cadena de búsqueda de expresiones regulares./ X funciona igual que tener ambos
^
al principio y$
al final de una cadena de búsqueda de expresiones regulares.El límite de palabras de expresiones regulares
\<
debe ser el primer término en la expresión regular. La expresión regular no coincidirá con nada si otros caracteres le preceden.\<
corresponde al principio de la entrada, el comienzo de una línea (la posición que sigue inmediatamente a un <LF>) o la posición que sigue inmediatamente a cualquier carácter "sin palabra". El siguiente carácter no necesita ser un carácter de "palabra".\>
debe ser el último término en la expresión regular. La expresión regular no coincidirá con nada si algún otro personaje la sigue.\>
corresponde al final de la entrada, la posición inmediatamente anterior a un <CR>, o la posición inmediatamente anterior a cualquier carácter "sin palabra". El carácter anterior no necesita ser un carácter de "palabra".Aquí hay una lista completa de caracteres "que no son palabras", representados como el código de byte decimal. Nota: esta lista se compiló en una máquina estadounidense. No sé qué impacto pueden tener otros idiomas en esta lista.
Rangos de clases de caracteres de expresión regular [xy]
Los rangos de clases de caracteres no funcionan como se esperaba. Vea esta pregunta: ¿Por qué los hallazgos no manejan el caso correctamente (en algunas circunstancias)? , junto con esta respuesta: https://stackoverflow.com/a/8767815/1012053 .
El problema es que FINDSTR no clasifica los caracteres por su valor de código de byte (comúnmente conocido como el código ASCII, pero ASCII solo se define de 0x00 a 0x7F). La mayoría de las implementaciones de expresiones regulares tratarían [AZ] como todas las mayúsculas en inglés en mayúsculas. Pero FINDSTR usa una secuencia de clasificación que corresponde aproximadamente a cómo funciona SORT. Por lo tanto, [AZ] incluye el alfabeto inglés completo, tanto mayúsculas como minúsculas (excepto "a"), así como caracteres alfabéticos que no están en inglés con signos diacríticos.
A continuación se muestra una lista completa de todos los caracteres admitidos por FINDSTR, ordenados en la secuencia de clasificación utilizada por FINDSTR para establecer rangos de clase de caracteres regex. Los caracteres se representan como su valor de código de byte decimal. Creo que la secuencia de clasificación tiene más sentido si los caracteres se ven usando la página de códigos 437. Nota: esta lista se compiló en una máquina estadounidense. No sé qué impacto pueden tener otros idiomas en esta lista.
Límite de término de clase de carácter de expresión regular y ERROR
FINDSTR no solo está limitado a un máximo de 15 términos de clase de carácter dentro de una expresión regular, sino que no puede manejar adecuadamente un intento de exceder el límite. El uso de 16 o más términos de clase de caracteres da como resultado una ventana emergente interactiva de Windows que dice "La utilidad Buscar cadena (QGREP) ha encontrado un problema y debe cerrarse. Disculpe las molestias". El texto del mensaje varía ligeramente según la versión de Windows. Aquí hay un ejemplo de un FINDSTR que fallará:
Este error fue reportado por el usuario de DosTips Judago aquí . Se ha confirmado en XP, Vista y Windows 7.
Las búsquedas de expresiones regulares fallan (y pueden colgar indefinidamente) si incluyen el código de byte 0xFF (decimal 255)
Cualquier búsqueda de expresiones regulares que incluya el código de byte 0xFF (255 decimal) fallará. Falla si el código de byte 0xFF se incluye directamente, o si se incluye implícitamente dentro de un rango de clase de caracteres. Recuerde que los rangos de clase de caracteres FINDSTR no clasifican caracteres en función del valor del código de byte. El carácter
<0xFF>
aparece relativamente temprano en la secuencia de colación entre los caracteres<space>
y<tab>
. Por lo tanto, cualquier rango de clase de personaje que incluya ambos<space>
y<tab>
fallará.El comportamiento exacto cambia ligeramente según la versión de Windows. Windows 7 se bloquea indefinidamente si se incluye 0xFF. XP no se bloquea, pero siempre no puede encontrar una coincidencia y ocasionalmente imprime el siguiente mensaje de error: "El proceso intentó escribir en una tubería inexistente".
Ya no tengo acceso a una máquina Vista, por lo que no he podido probar en Vista.
Error de expresión regular:
.
y[^anySet]
puede coincidir con el final del archivoEl metacarácter de expresión regular
.
solo debe coincidir con cualquier carácter que no sea<CR>
o<LF>
. Hay un error que le permite coincidir con el Fin de archivo si la última línea del archivo no termina con<CR>
o<LF>
. Sin embargo,.
no coincidirá con un archivo vacío.Por ejemplo, un archivo llamado "test.txt" que contiene una sola línea de
x
, sin terminar<CR>
o<LF>
, coincidirá con lo siguiente:Este error ha sido confirmado en XP y Win7.
Lo mismo parece ser cierto para los conjuntos de caracteres negativos. Algo así
[^abc]
coincidirá con Fin de archivo. Los juegos de caracteres positivos[abc]
parecen funcionar bien. Solo he probado esto en Win7.fuente
type
enfindstr
.findstr
admite múltiples/c:
cadenas de búsqueda. Sé que tus respuestas demuestran esto. Pero es algo que no está documentado; y me sorprendió bastante conocer la función después de haberla usadofindstr
sin ella durante algunos años.LF
problema que documentó. Me di cuenta de que mi archivo de prueba no terminabaLF
porque lo usécopy
en modo de adición para crearlo. Puse una sesión de línea de comando para demostrar el problema en una respuesta ( stackoverflow.com/a/22943056/224704 ). Tenga en cuenta que la entrada no se redirige y, sin embargo, la búsqueda se bloquea. El mismo comando de búsqueda no se cuelga con archivos más pequeños que tampoco terminan de manera similarLF
.findstr /R /C:"^[0-9][0-9]* [0-3][0-9][0-9]-[0-9][0-9]:[0-5][0-9]:[0-5][0-9]\.[0-9][0-9]* [0-9]*\.[0-9]*"
(15 clases de personajes) -ErrorLevel = -1073740791 (0xC0000409)
, la ventana de diálogo de error :Find String (QGREP) Utility has stopped working
; después de eliminar una clase o dos*\.
findstr
a veces se cuelga inesperadamente al buscar archivos grandes.No he confirmado las condiciones exactas o los tamaños de los límites. Sospecho que cualquier archivo de más de 2 GB puede estar en riesgo.
He tenido experiencias mixtas con esto, por lo que es más que solo el tamaño del archivo. Parece que puede ser una variación de FINDSTR que se bloquea en XP y Windows 7 si la entrada redirigida no termina con LF , pero como se demostró, este problema particular se manifiesta cuando la entrada no se redirige.
La siguiente sesión de línea de comandos (Windows 7) muestra cómo se
findstr
puede bloquear al buscar un archivo de 3 GB.Tenga en cuenta que he verificado en un editor hexadecimal que todas las líneas están terminadas con
CRLF
. La única anomalía es que el archivo finaliza0x1A
debido a la forma en quecopy
funciona . Sin embargo, tenga en cuenta que esta anomalía no causa un problema en los archivos "pequeños" .Con pruebas adicionales, he confirmado lo siguiente:
copy
con la/b
opción de archivos binarios evita la adición del0x1A
carácter yfindstr
no se bloquea en el archivo de 3 GB.findstr
que se cuelgue.0x1A
personaje no causa ningún problema en un archivo "pequeño". (Del mismo modo para otros caracteres finales).CRLF
después0x1A
resuelve el problema. (LF
por sí solo probablemente sería suficiente).type
para canalizar el archivo enfindstr
obras sin colgar. (Esto podría deberse a un efecto secundario de cualquieratype
o|
que inserta un Fin de línea adicional).<
también hacefindstr
que se cuelgue. Pero esto se espera; como se explica en la publicación de dbenham : "la entrada redirigida debe terminar enLF
" .fuente
<LF>
. Un archivo dos bytes más pequeño no se colgó. ¡Muy asqueroso!Cuando varios comandos están encerrados entre paréntesis y hay archivos redirigidos a todo el bloque:
... entonces los archivos permanecen abiertos mientras los comandos en el bloque estén activos, por lo que los comandos pueden mover el puntero de los archivos redirigidos. Los comandos MORE y FIND mueven el puntero del archivo Stdin al comienzo del archivo antes de procesarlo, por lo que el mismo archivo puede procesarse varias veces dentro del bloque. Por ejemplo, este código:
... produce el mismo resultado que este:
Este código:
... produce el mismo resultado que este:
FINDSTR es diferente; sí no mover el puntero del archivo Stdin desde su posición actual. Por ejemplo, este código inserta una nueva línea después de una línea de búsqueda:
Podemos hacer un buen uso de esta función con la ayuda de un programa auxiliar que nos permita mover el puntero de un archivo redirigido, como se muestra en este ejemplo .
Este comportamiento fue reportado por primera vez por jeb en esta publicación .
EDITAR 2018-08-18 : Nuevo error FINDSTR reportado
El comando FINDSTR tiene un error extraño que ocurre cuando este comando se usa para mostrar caracteres en color Y la salida de dicho comando se redirige al dispositivo CON. Para obtener detalles sobre cómo usar el comando FINDSTR para mostrar texto en color, consulte este tema .
Cuando la salida de esta forma de comando FINDSTR se redirige a CON, sucede algo extraño después de que el texto se emite en el color deseado: todo el texto después de que se emite como caracteres "invisibles", aunque una descripción más precisa es que el texto es salida como texto negro sobre fondo negro. El texto original aparecerá si usa el comando COLOR para restablecer los colores de primer plano y fondo de toda la pantalla. Sin embargo, cuando el texto es "invisible" podríamos ejecutar un comando SET / P, por lo que todos los caracteres ingresados no aparecerán en la pantalla. Este comportamiento puede usarse para ingresar contraseñas.
fuente
Me gustaría informar un error relacionado con la sección Fuente de datos para buscar en la primera respuesta cuando se usa en dash (-) o em dash (-) dentro del nombre de archivo.
Más específicamente, si está a punto de utilizar la primera opción: nombres de archivo especificados como argumentos , no se encontrará el archivo. Tan pronto como utilice la opción 2 - stdin a través de la redirección o 3 - flujo de datos desde una tubería , findtr encontrará el archivo.
Por ejemplo, este script por lotes simple:
imprimirá:
Nombre de archivo con en dash:
Como argumento
FINDSTR: No se puede abrir el nombre de archivo con - dash.txt
Como stdin a través de la redirección
, soy el archivo con un guión.
Como flujo de datos de una tubería
, soy el archivo con un guión.
Nombre de archivo con em dash:
Como argumento
FINDSTR: No se puede abrir el nombre de archivo con - dash.txt
Como stdin a través de la redirección
, soy el archivo con un guión em.
Como flujo de datos de una tubería
, soy el archivo con un guión em.
Espero eso ayude.
METRO.
fuente
El
findstr
comando establece elErrorLevel
(o código de salida) en uno de los siguientes valores, dado que no hay modificadores inválidos o incompatibles y ninguna cadena de búsqueda excede el límite de longitud aplicable:0
cuando se encuentra al menos una sola coincidencia en una línea en todos los archivos especificados;1
de otra manera;Se considera que una línea contiene una coincidencia cuando:
/V
se da ninguna opción y la expresión de búsqueda ocurre al menos una vez;/V
se da la opción y la expresión de búsqueda no aparece;Esto significa que la
/V
opción también cambia el valor devueltoErrorLevel
, ¡pero no solo lo revierte!Por ejemplo, cuando tiene un archivo
test.txt
con dos líneas, una de las cuales contiene la cadenatext
pero la otra no, ambasfindstr "text" "test.txt"
yfindstr /V "text" "test.txt"
devuelven unaErrorLevel
de0
.Básicamente puede decir: si
findstr
devuelve al menos una línea,ErrorLevel
se establece en0
, de lo contrario a1
.Tenga en cuenta que la
/M
opción no afecta elErrorLevel
valor, solo altera la salida.(Solo por completo: el
find
comando se comporta exactamente de la misma manera con respecto a la/V
opción yErrorLevel
; la/C
opción no afectaErrorLevel
).fuente
FINDSTR tiene un error de color que describí y resolví en /superuser/1535810/is-there-a-better-way-to-mitigate-this-obscure-color-bug-when-piping-to -findstr / 1538802? noredirect = 1 # comment2339443_1538802
Para resumir ese hilo, el error es que si la entrada se canaliza a FINDSTR dentro de un bloque de código entre paréntesis, los códigos de color de escape ANSI en línea dejan de funcionar en los comandos ejecutados más tarde. Un ejemplo de códigos de colores en línea es:
echo %magenta%Alert: Something bad happened%yellow%
(donde magenta y amarillo son variables definidas anteriormente en el archivo .bat como los códigos de color de escape ANSI correspondientes).Mi solución inicial fue llamar a una subrutina de no hacer nada después de FINDSTR. De alguna manera, la llamada o el retorno "restablece" lo que sea necesario restablecer.
Más tarde descubrí otra solución que presumiblemente es más eficiente: coloque la frase FINDSTR entre paréntesis, como en el siguiente ejemplo:
echo success | ( FINDSTR /R success )
Colocar la frase FINDSTR dentro de un bloque anidado de código parece aislar el error de código de color de FINDSTR para que no afecte lo que está fuera del anidado bloquear. Quizás esta técnica también resolverá algunos otros efectos secundarios FINDSTR no deseados .fuente
/ D consejo para múltiples directorios: ponga su lista de directorios antes de la cadena de búsqueda. Todo esto funciona:
Como se esperaba, la ruta es relativa a la ubicación si no inicia los directorios con
\
. Rodear la ruta con"
es opcional si no hay espacios en los nombres de directorio. El final\
es opcional. La salida de ubicación incluirá cualquier ruta que le des. Funcionará con o sin rodear la lista de directorios con"
.fuente
/D:dirlist Search a semicolon-delimited list of directories
y se coloca antes de la cadena de búsqueda, por lo que no entiendo qué es exactamente lo que "encontró" sobre el modificador / D (y cuáles son los "comandos que NO funciona ") ...findstr
listas / D primero. Sí, no tengo ningún argumento con la característica que se está documentando, simplemente no está documentado sobre el problema que importa el orden de los atributos. Hago muy poco trabajo en la línea de comandos, por lo que cuando estaba manipulando un comando, sin darme cuenta de que el orden marcaba la diferencia, solo estaba agregando los atributos a medida que los recibía (y alfabéticamente, C precede a D). Me estaba frustrando mucho y he compartido mi experiencia "encontrada" con cualquier otra persona que no trabaja mucho con la línea de comandos.findstr
documentación especifica que lastrings
parte NO es opcional y que debe colocarla después de los atributos opcionales y antes de la lista de nombre de archivo opcional . Si "lo que encontró" es que usar un comando sin seguir su formato de uso causa un error, entonces ese punto está bien documentado. Consulte Sintaxis del comando : "La sintaxis aparece en el orden en que debe escribir un comando y los parámetros que lo siguen"