¿Cuáles son las dificultades técnicas detrás de la construcción de un sensor con alto rango dinámico como el ojo humano?

17

¿Por qué todavía no disponen de sensores de alto rango dinámico, que tienen la exposición correcta en todas las partes de una imagen?

Andreas Hartmann
fuente
2
En realidad, después de responder, vi que esto ya se ha discutido aquí . Si eso no responde a todo por ti, considerar la expansión de su pregunta con más detalles.
mivilar
Un Blackmagic (vídeo Full HD) cámara tiene un EV de 14 años, modernas cámaras de vídeo profesionales (4K) tiene 18 EV. Así que tenemos estos sensores ...
TFuto

Respuestas:

20

Existe ya la cámara de la RD son más grandes que el ojo humano, tanto de forma instantánea y global. el rango dinámico del ojo humano no es tan grande como la mayoría de la gente tiende a pensar que es. Por lo que recuerdo, que es de alrededor de 12 a 16 vehículos eléctricos, que está justo en torno al nivel de una réflex digital moderna.

La principal diferencia es que tenemos un control de apertura extremadamente natural que se ajustará a diferentes partes de la imagen. Efectivamente, nuestros cerebros apilan imágenes automáticamente. Cuando miramos la parte brillante de una escena, nuestras pupilas se encogen y vemos los detalles de la parte brillante. Si cambiamos nuestro enfoque a la parte más oscura, nuestras pupilas se abren rápidamente y vemos los detalles de la parte oscura. Nuestro cerebro sabe cómo era la parte anterior y, por lo tanto, no notamos el cambio en nuestra visión periférica, pero en realidad ya no estamos viendo tantos detalles donde ya no estamos enfocados.

Del mismo modo, incluso para el rango general de la visión humana, hay cámaras especializadas que pueden ir mucho más oscuras que nosotros y aún ver, particularmente el color, actualmente son demasiado caras de producir para el público en general, ya que requieren materiales y construcción de muy alta calidad para consigue el piso de ruido super bajo. También hay sensores capaces de mirar objetos muy brillantes que serían dolorosos para la gente.

AJ Henderson
fuente
AJ, DSLR no tienen el mismo rango dinámico como el ojo. para DSLR es 2 en poder de 14, para el ojo humano es 10 en potencia de 14
Romeo Ninov
@RomeoNinov - no para DR instante, sólo por aparente. ¿Tiene una fuente para su reclamo? Mi fuente está aquí "si tuviéramos que considerar el rango dinámico instantáneo de nuestro ojo (donde la apertura de nuestra pupila no cambia), entonces las cámaras funcionan mucho mejor. Esto sería similar a mirar una región dentro de una escena, dejar que nuestros ojos se ajusten, y sin mirar en ningún otro lugar en ese caso, la mayor estimación de que nuestros ojos pueden ver en cualquier lugar a partir de 10-14 diafragmas de rango dinámico".
AJ Henderson
@RomeoNinov: un recurso ligeramente mejor . Por lo tanto, vale la pena señalar que a nuestros ojos les va mejor donde a las cámaras les va mal, pero a nuestros ojos les va peor donde las cámaras les va mejor. En las sombras, tenemos 20EVs donde como cámaras han reducido los vehículos eléctricos. En el brillo tenemos alrededor 10EVs pero las cámaras tienen su máximo a 12 14EVs. El 10 ^ 14 es el rango total que podemos ver cuando nuestros ojos se ajustan, no lo que vemos en cualquier momento. Y en ese sentido, las cámaras no están limitados a 2 ^ 14 tampoco.
AJ Henderson
Sí, las cámaras se limitan a los bits de profundidad de su imagen en bruto. No se puede conseguir más bits o más información de la imagen. Estoy de acuerdo en que el cerebro la imagen de "ver" no es de una sola instantánea del ojo, por otra parte utilizamos dos ojos, lo que añade mucha información adicional a la imagen en el cerebro. Y en el recurso que mencionas en el segundo comentario, ves el rango dinámico de los ojos en potencia de 10. Lo que solo confirma mis palabras. Incluso si DR es solamente 12 EV es 10 ^ 12 que es milion milions, en comparación con 2 ^ 14, que es 16384
Romeo Ninov
1
Pero incluso un sensor severamente limitado a, digamos, un DR seis parada en un momento dado puede ser usado para medir el detalle de muy oscuro a valores muy brillantes en cuadros sucesivos mediante la alteración de la Tv y Av! En términos de apertura, eso es lo que hace el sistema ojo / cerebro.
Michael C
10

Ver es un proceso activo

Un gran problema es que mira con sus ojos es muy diferente a la captura de una imagen - que necesita un imagen para incluir toda la información que el espectador puede ver, pero la visión normal es un proceso activo que implica el movimiento de los ojos, la reorientación y dilatación de pupilas de acuerdo a los objetos que estamos mirando. Por lo tanto, si desea capturar "lo que el ojo ve" lo que necesita, en esencia, captar el punto de vista de todos los ajustes que el ojo podría utilizar.

Su pregunta es sobre el rango dinámico, pero el mismo problema aparece con detalles visuales y enfoque. Una imagen 'equivalente a la vida' necesita mucho, mucho más píxeles de los que su ojo puede capturar, ya que la resolución del ojo es muy desigual y mientras mira solo un pequeño punto con su retina media de alta resolución, necesita una imagen más detalles disponibles ya que vas a mover los ojos. Las películas deben elegir un solo foco, mientras que un humano puede ver una 'imagen única' con más profundidad al reenfocar rápidamente los ojos y / o moverlos para una visión binocular adecuada en diferentes rangos previstos (por ejemplo, mirando la superficie de una ventana o a través de ella) ), etc.

Parte de la solución es exactamente eso - el uso de una sola cámara varias veces rápidamente (o varias cámaras) para capturar una variedad de imágenes en diferentes configuraciones y unirlos después, HDR es el ejemplo más flagrante - al igual que nuestro ojo lo hace, de forma activa miradas en varios lugares diferentes con diferentes "configuración", y sólo después sus fusiona cerebrales que todos en una imagen coherente o una película. Las "imágenes" reales tomadas por nuestros ojos ya están peor que buenas cámaras, simplemente la combinación mental de ellos es agradable.

Pedro es
fuente
1
1 para el punto de enfoque acerca de las películas. Esto también se relaciona con una de las principales razones por las que muchas personas con dolores de cabeza durante la visualización de películas en 3D. El ojo debe enfocarse físicamente en la pantalla, pero la imagen estereoscópica engaña al cerebro para que piense que algunas partes de la pantalla están más cerca o más lejos de lo que realmente están, causando fatiga visual cuando intenta mirarlas directamente. Estudios tratan de minimizar esta mostrando el punto focal de la escena en el mismo lugar, en tanto las imágenes izquierda y derecha. Así que si te gusta mirar a su alrededor en los detalles del fondo, no se olvide el ibuprofeno!
bcrist
El hecho de que ver es un proceso activo es una de las razones por las que realmente buenos artistas pueden producir pinturas que se ven mejor que una simple fotografía. Una fotografía simple capturará todo en la escena con las mismas características de punto de vista, enfoque, exposición y balance de blancos, mientras que los ojos de alguien que realmente estaba viendo la escena pueden ajustarse constantemente a medida que observan diferentes partes. Un pintor, a diferencia de una cámara, se puede producir una imagen en la que cada parte de las miradas de la escena que iba a una persona que era en realidad en ese lugar, mirándolo.
supercat
6

Su imagen mental es producto no sólo de la retina, pero su interacción con los demás todos los componentes que intervienen en la visión, incluyendo la pupila y, por supuesto, su cerebro. Lo que puede parecer a usted como 'una imagen' es en realidad el resultado de los ajustes de alta velocidad y procesamiento de la información y no una sola instantánea.

Puede encontrar más información sobre este tema aquí .

mivilar
fuente
1

Es perfectamente posible hacer un sensor de luz con propiedades logarítmicas - sensor de este tipo tendría un increíble rango dinámico a expensas de la resolución limitada para una exposición particular. Conseguir tanto requiere un ADC de alta resolución. Para la formación de imágenes CT 24 bits lineal se utiliza normalmente - y luego el logaritmo se toma después de ajuste de la desviación para crear la imagen de TC.

Un sensor que hace tanto el control de la exposición (tiempo de integración - pensar velocidad de obturación) puede hacer mejor, y si usted permite que los cambios en la eficiencia de recogida de luz (f pensar en número) se obtiene una flexibilidad aún mayor.

rango dinámico máximo es típicamente limitada por ruido de lectura - cuando se lee la carga acumulada habrá algún error - en comparación con la señal más grande que el apoyo lata electrónico. Como dije - 24 bits es común en imágenes médicas y que es mejor que 1 parte en 10 millones. Eso es un rango dinámico mucho más alta que la retina para una exposición dada. Pero es que no se utiliza comúnmente en las cámaras convencionales debido a que el ojo no podía apreciar esos detalles en la imagen - y la resolución se produce a expensas de la velocidad.

Floris
fuente