¿Hay alguna forma de buscar en un PDF los caracteres no alfanuméricos (por ejemplo, el signo integral o las letras griegas)?

3

Leí muchos documentos técnicos y libros de texto en PDF que utilizan la notación matemática estándar y, a veces, me gustaría poder encontrar dónde hay un símbolo en el texto. La única razón por la que creo que esto podría ser posible es que puedo seleccionarlos con la herramienta de selección, al igual que con cualquier otro texto. En este momento estoy viendo una fórmula que incluye un delta constante, y sería bueno poder buscar en el PDF instancias del delta para poder encontrar la definición aquí. He intentado usar códigos ASCII para algunas cosas y colocarlos en la barra de búsqueda en FoxitReader, pero no encuentra los símbolos. Estoy dispuesto a usar cualquier lector de PDF en Windows o Linux que tenga esta funcionalidad.

¡Gracias!

EDITAR: Lo que quiero decir cuando digo que traté de usar el código ASCII es que usé alt + ... para escribir el carácter (o usar el Mapa de caracteres) y colocarlos en la barra de búsqueda. Sin suerte.

raoulcousins
fuente

Respuestas:

2

Necesitas usar el símbolo real. Puedes obtenerlos desde el mapa de personajes.

Otra opción sería utilizar la distribución del teclado griego. También puede intentar usar un programa de teclas de acceso rápido y un mapa de caracteres. De esta manera, podría configurar los caracteres comunes para que estén en algunas teclas de acceso rápido.

Otra opción sería utilizar las teclas modificadoras y la distribución personalizada del teclado. Podrías usar por ejemplo esta para hacer su propio teclado que tenga letras fácilmente accesibles como sigma o delta. Puede usar alt como una tecla modificadora para acceder a esos caracteres o shift + alt o algo similar.

No tengo problemas para buscar caracteres no-ascii en archivos PDF en Sumatra, así que puedes intentarlo si nada más funciona.

Dependiendo de las páginas de códigos que use su sistema, puede tener algo de suerte con códigos alt (Parece que hay hack para que funcione con Unicode también). Active el bloqueo numérico y presione la tecla derecha derecha (puede funcionar con la izquierda también en algunos casos). Luego escriba un número en el teclado y suelte la tecla alt. En algunas páginas de códigos (como esta uno), ALT + 235 puede hacer "δ", pero en vez de eso obtengo "в". Si los códigos ALT funcionan para usted, eche un vistazo aquí . Los códigos alternativos para los símbolos matemáticos de uso frecuente se pueden encontrar allí.

También el documento en sí debe ser investigable. Si los símbolos matemáticos se muestran como imágenes en lugar de texto, realmente no sé cómo los buscaría.

AndrejaKo
fuente
Ver mi edición Esto no funciona para mí en Sumatra o Foxit, pero podría ser este documento específico. Supongo que las letras griegas se muestran como texto y no como imágenes, ya que puedo resaltarlas.
raoulcousins
@ user34605 Pruebe varios documentos y dé resultados. Además, prueba con esta pdf (es la política de certificación para el Ministerio de Asuntos Internos de CA de mi país, por lo que debe estar libre de malware y lleno de caracteres que no sean ascii) y busque la palabra ПОЛИТИКА que debe estar en la primera página. De esta manera sabremos si el problema está en un archivo en particular o si está en su computadora.
AndrejaKo
Parece ser culpa del documento. La diferencia que observo es que cuando selecciono ПОЛИТИКА y lo copio desde el portapapeles, obtengo ПОЛИТИКА, y cuando resalto una de las letras griegas en el documento, obtengo algo diferente en la parte posterior. no se muestra a la derecha). Curiosamente, cuando busco el PDF para Ȗ encuentro instancias de gamma en minúsculas. Esto efectivamente resuelve mi problema! Extraño.
raoulcousins