Estoy usando mi S95 para fotografiar documentos de texto (papel y microfilm) para OCR. Ya he preguntado sobre los problemas de cómo fotografiar mejor una pantalla de computadora para microfilm, pero he estado pensando en la mejor manera de fotografiar texto para que el texto salga claro y nítido. Aquí están mis pensamientos actuales, pero me gustaría escuchar lo que cualquiera que tenga más experiencia en fotografía que yo tenga que decir:
Estoy usando un número menor de megapíxeles (alrededor de 6-7MP en lugar del máximo del S95, que es 10MP), para que los archivos PDF resultantes no maten a mi computadora cuando realmente voy a desplazarme por ellos.
Apertura: inferior (p. Ej. F / 6.3), de modo que si la cámara no está exactamente paralela a la página, el texto permanecerá enfocado
Velocidad de obturación: hay una compensación aquí, porque las bibliotecas generalmente tienen poca luz, por lo que me gustaría reducir la velocidad de obturación para aumentar la exposición, pero sin un trípode, existe la posibilidad de que la cámara se tambalee
ISO: no estoy muy seguro de cómo esto lo afectaría.
Balance de blancos: de nuevo, no estoy del todo seguro.
He estado experimentando con diferentes configuraciones en mi cámara, pero estoy aprendiendo sobre fotografía y me gustaría saber si alguien tiene alguna sugerencia sobre cómo fotografiar mejor el texto, de libros o de documentos, que sea fácil de leer.
Respuestas:
Si su cámara tiene un modo blanco y negro, lo intentaré para reducir el tiempo de procesamiento posterior. Además, muchos programas de OCR con los que he trabajado funcionan mucho mejor en blanco y negro.
Querrás ponerte lo más paralelo posible a la página, porque para reducir el movimiento de la cámara al sostener la mano, es probable que necesites tu mayor apertura para maximizar la velocidad de obturación. El pequeño sensor de su s95 debería aumentar su DOF lo suficiente como para abrir la apertura lo más que pueda.
Teniendo en cuenta que solo va a ejecutar esto a través de OCR, aumente su ISO hasta lo que le dé una exposición adecuada con un mínimo de sacudidas. Es mucho menos probable que el OCR se queje del ruido adicional que las letras borrosas.
El balance de blancos, si solo está hablando de texto, debe ser para cualquier configuración "interior" de su cámara, pero, francamente, no se preocupe demasiado por eso.
Es posible que sus megapíxeles solo importen si el texto de su documento es increíblemente pequeño y necesitará resolver claramente ese nivel de detalle, pero supongo que 6-7 estará bien para la mayoría de las cosas.
fuente
Parece que ya tiene una buena comprensión de la configuración. El movimiento de la cámara arruinará la legibilidad del texto más que cualquier otra cosa, por lo que optimizaría eso primero. Si no puede usar un trípode, asegúrese de que la velocidad de obturación sea al menos 1 sobre su distancia focal (equivalente a 35 mm). Alejarlo hará que esto sea más fácil. Use la estabilización de imagen si la tiene.
La apertura se puede establecer bastante amplia, solo asegúrese de estar en paralelo con la página. Una apertura amplia ayudará con la velocidad de obturación, de nuevo, el desenfoque debido a la apertura amplia no es nada en comparación con el desenfoque debido al movimiento de la cámara.
ISO, lo que sea que necesites para tener una buena exposición. El ruido no debería afectar la legibilidad hasta que se vuelva realmente malo.
Sería preferible tomar un balance de blancos personalizado basado en el papel en sí, pero el software OCR debería ser capaz de hacer frente a un fondo blanco roto.
fuente
Supongo que está convirtiendo archivos JPEG a PDF. Recomiendo capturar el máximo y usar un programa para reducir el tamaño a 6-7 MP con nitidez aplicada después del tamaño reducido y antes de la conversión a PDF.
Para aclarar, desea una apertura más estrecha para una profundidad de campo más amplia, que es un número de f-stop más alto. (por ejemplo, quiere f / 8 en lugar de f / 2). Con texto para facilitar la lectura, intente que la cámara apunte lo más perpendicular posible para que no tenga que preocuparse por la profundidad de campo. Es una buena idea detenerse un poco para evitar aberraciones como CA que verá con texto negro sobre blanco. Cuanto más cerca esté del papel, menor será la profundidad de campo.
Esto probablemente tendrá el mayor efecto en la legibilidad si está sujetando la mano. Si está sujetando la mano, desea seleccionar una velocidad de obturación tal que sea más rápida que 1 / (longitud focal equivalente a 35 mm), o incluso más rápida. Esto depende de la configuración de zoom que esté utilizando en su P&S. Si usa el extremo ancho, puede escapar con velocidades de obturación más largas, pero puede obtener una distorsión de barril. Si está fotografiando documentos de texto y no una pantalla de computadora, le recomiendo probar con un flash.
Si puede, sostenga el documento (pegado con cinta adhesiva o algo así para que quede plano) para que pueda descansar la cámara sobre algo y obtener la velocidad de obturación que desee. También puede usar una bolsa de frijoles u objetos pequeños para inclinar la cámara mientras descansa. Además, puede obtener adaptadores de trípode de botella de agua para un P&S.
La apertura, la velocidad de obturación y el ISO forman un triángulo de exposición. Lea sobre esto aquí . Cuanto mayor sea el ISO, la apertura más estrecha y la velocidad de obturación más corta que puede usar, pero la imagen será más ruidosa. Recomiendo un ISO bajo (400 o menos) para un P&S con texto.
Seleccione el balance de blancos para su situación de iluminación. Si tienes fluorescente, úsalo. Si usa flash, use el balance de blancos del flash.
fuente
Estoy de acuerdo con las sugerencias para disparar en la resolución más alta disponible y reducir el tamaño en la computadora. Además, elija el jpeg de la más alta calidad que pueda obtener de su cámara, o incluso dispare sin formato si su cámara lo permite, y conviértalo en tiff o png. La compresión con pérdida en jpeg puede crear artefactos alrededor del límite de tinta / papel que podrían confundir su software ocr.
En general, lo que desea hacer es usar la configuración que obtendrá la imagen más nítida que pueda obtener. Cosas como el contraste, el balance de blancos, etc. se pueden cambiar en la computadora. De hecho, aumentar el contraste usando la herramienta de niveles o la herramienta de contraste / brillo en Photoshop o GIMP podría ayudarlo mucho.
Además, la conversión al formato de escala de grises reducirá sustancialmente el tamaño de sus archivos. Y si hace eso y aumenta el contraste, realmente no tiene que preocuparse por el balance de blancos. Sin embargo, puede experimentar con el balance de blancos, algunos ajustes pueden producir un mejor contraste que otros (depende de su iluminación).
Si su computadora puede manejarlo, haga todos los ajustes (escala de grises, contraste, brillo) antes de reducir el tamaño y, después de reducir el tamaño, aplique un filtro de nitidez a la imagen.
fuente
Algunos pensamientos, que no he notado en ninguna otra parte, para agregar a la mezcla:
Si dispara "con zoom" (más teleobjetivo ), hará que dispare más lejos de la página, lo que le dará una imagen más consistente con respecto al tamaño del texto (las palabras en una esquina estarán más cerca del mismo tamaño que las palabras en el medio; con gran angular, puede obtener distorsión con respecto a esto). No estoy seguro de cuál es la configuración "ideal", aquí, y es una compensación contra las velocidades de obturación requeridas, potencialmente, solo algo en lo que pensar.
Querrá " sobreexponer " frente a lo que su cámara probablemente piense que es lo correcto por defecto (a menos que sea lo suficientemente inteligente como para adivinar que esto es papel; lo puse entre comillas porque realmente no desea exponerlo demasiado , simplemente sobreexponer basado en la medición de una página en blanco), porque el tono principal (el papel en sí) será lo principal para lo que la cámara intenta exponer, y si expone el papel como gris medio, tendrá Un punto de partida más turbio. Si se "sobreexpone" por una parada y media o 2 paradas (simplemente no vaya al punto de recortar los resaltados), el texto aún debe ser agradable y oscuro, pero el papel será agradable y brillante, haciendo separaciones de contraste ( y por lo tanto OCR) más fácil.
trate de tener una iluminación uniforme : si una esquina de la página es mucho más clara u oscura que otra, esto hará que sea más difícil separar las cosas en el negro puro y el blanco puro que probablemente desee para fines de OCR.
un "soporte de copia" es ideal para proyectos como este, aunque supongo que más allá de lo que podría tener fácilmente en la biblioteca ... Sin embargo, dependiendo de la configuración de su biblioteca, es posible que haya algún lugar (quizás un estante sobre el escritorio, o una varilla que sostiene la iluminación o similar?) donde podría colocar una súper abrazadera con una cabeza de bola ( aquí hay una , pero cualquier súper abrazadera con un "perno" de tamaño apropiado (dependiendo de la cabeza) y algún tipo de trípode cabeza)), y luego su cámara se monta sobre la superficie del escritorio (o lo que sea), para que pueda tener un posicionamiento constante y estabilidad en caso de que necesite exposiciones más largas. Básicamente, esto equivaldría a un soporte de copia de "pobre".
También es posible que desee utilizar un temporizador o control remoto corto (imagino que su cámara tiene un modo de temporizador de 2 segundos, y quizás uno personalizado que podría ser incluso más corto), para evitar que la cámara se mueva al presionar el botón.
Eso es todo lo que estoy pensando por el momento. Espero que sea útil.
fuente
Tengo el mismo trabajo que tu foto de landman y lo he hecho durante años y años. La mayoría de la gente no sabe de qué están hablando, ¡confía en mí!
La cámara en M o manual
Iso 100-200 cuanto más alto, # más brillante, pero obtiene más grano o ruido en la imagen
Velocidad de obturación 1/100 a 1/160 (generalmente 1/125 es lo mejor, cuanto más bajo es el más brillante, pero obtiene más entierros o retoma)
Apertura o f2.7 (¿por qué necesitarías un campo de visión profundo? Es una página plana)
Dispare en color, de 6 a 10 megapíxeles, mire a través de la configuración del balance de blancos, generalmente fluorescente 1 o 2, apague la mayoría de las campanas y silbe si Ur no está seguro de apagarlo
exponer fotos en comp usando acdc
fuente
Algunas pequeñas sugerencias, pero creo que su configuración se ve bien
Usa un trípode. Esto eliminará cualquier problema con el movimiento de la cámara y le permitirá usar la exposición que necesite durante el tiempo que sea necesario.
Evite que la luz caiga directamente sobre el papel en un ángulo que pueda reflejarse directamente en la lente y provocar un resaltado donde no desee uno. Esto generalmente significa asegurarse de que la luz provenga de los lados.
ISO: Como regla general, debe errar hacia un valor más bajo, pero estoy seguro de que cualquier diferencia material se hará evidente rápidamente.
Aparte de eso, no puedo pensar en ninguna forma de mejorar su configuración. Para ser honesto, creo que lo tienes.
fuente
Parece que ya tienes la mayoría de las respuestas :-P Solo agregaré algunos comentarios sobre tus puntos:
Resolución: tiene razón, no necesitará mucha resolución aquí, especialmente si solo va a ver las imágenes en pantalla. Probablemente yo mismo lo limite al doble de la resolución de pantalla típica máxima.
Apertura: está en lo correcto al seleccionar una abertura más pequeña para obtener un poco de margen de maniobra de profundidad de campo. Sin embargo, probablemente no va a necesitar mucho. Juega con la calculadora de profundidad de campo para tu distancia focal, calcula un DOF razonable y luego ve con la mayor apertura posible. (Sin embargo, asegúrese de estar a una o dos paradas debajo de su apertura máxima para obtener la mejor nitidez). Desea la mayor apertura para poder tener más espacio para jugar con el obturador y el ISO; vea abajo.
Obturador: obviamente desea que esto sea lo más rápido posible para reducir las sacudidas y al mismo tiempo obtener suficiente luz. He escuchado que varias fuentes afirman "velocidad de obturación igual a la distancia focal" para evitar sacudidas; Algunos afirman doble. Entonces, si está utilizando una lente de 50 mm, intente mantener la velocidad de obturación entre 1/50 y 1/100. Una vez que tenga eso, intente la velocidad más lenta para maximizar la luz.
ISO: deberías poder aumentar esto bastante alto. El ruido puede reducir el aspecto de la imagen, pero probablemente no degradará demasiado su legibilidad. Lo que es "ISO alto" y "demasiado ruidoso" depende de su cámara. Experimentar. Esta es probablemente la mejor manera de obtener la exposición correcta con poca luz, en comparación con la apertura y el obturador.
Balance de blancos: para ti, no debería importar demasiado. Si su papel fotografiado sale blanco, ¿importa? (Historia diferente si estás fotografiando libros con imágenes a todo color, por supuesto). Si desea corregirlo en la publicación, tendrá un tiempo relativamente fácil, ya que tiene muchos papeles de colores neutros para trabajar. Probablemente dejaría su cámara en el balance de blancos automático y me olvidaría de eso.
fuente