¿Por qué debería usar un bote logarítmico para aplicaciones de audio?

32

Me dio mucha curiosidad leer esta respuesta de Spehro Pefhany . Allí Spehro comenta que uno debería usar un bote logarítmico para aplicaciones de audio. Así que busqué en Google.

El mejor artículo que pude encontrar fue uno titulado "Diferencia entre audio y potenciómetros lineales" [1] que ahora parece haber sido eliminado del sitio web original.

Allí dijeron esto:

Lineal vs. Audio

Los potenciómetros, o "ollas" para los entusiastas de la electrónica, se diferencian por la rapidez con que cambia su resistencia. En macetas lineales, la cantidad de resistencia cambia en un patrón directo. Si lo gira o desliza hasta la mitad, su resistencia estará a la mitad entre su configuración mínima y máxima. Eso es ideal para controlar luces o un ventilador, pero no para controles de audio. Los controles de volumen tienen que atender al oído humano, que no es lineal. En cambio, las macetas logarítmicas aumentan su resistencia en una curva. En el punto medio, el volumen seguirá siendo moderado, pero aumentará bruscamente a medida que suba el volumen. Esto corresponde a cómo escucha el oído humano.

Bueno, no estoy satisfecho.

  • ¿Qué significa que el oído humano no es lineal?
  • ¿Cómo se relaciona el registro de cambios en la resistencia de la olla con las ondas de sonido y cómo funciona el oído humano?

[1] El enlace original (ahora roto) era http://techchannel.radioshack.com/difference-audio-linear-potentiometers-2409.html .

Ricardo
fuente
55
puede ser útil es.wikipedia.org/wiki/Psychoacoustics
kenny
3
Esta pregunta parece estar fuera de tema porque no está relacionada con el diseño electrónico, se trata más bien de ondas de sonido y cómo las percibe el oído humano.
alexan_e
17
@alexan_e Aunque la pregunta requiere algunos conocimientos de fisiología (que está fuera de tema), en última instancia, pregunta: "¿Por qué usar un estrechamiento logarítmico en lugar de lineal?" Esa es una pregunta de diseño electrónico, solo está informada por la biología. El diseño electrónico a menudo se trata de cómo diseñar algo que pueda ser utilizado por un ser humano y, para bien o para mal, que requiera aportes de otros campos de estudio.
JYelton
55
@alexan_e No digo que debamos aceptar preguntas que hacen exclusivamente sobre fisiología, sino preguntas que preguntan "¿Cómo logro X en el diseño electrónico?" donde X requiere campos de estudio externos, debe ser sobre el tema. Las preguntas audaces están fuera de tema, y ​​el OP idealmente debería hacerlas en un sitio adecuado. Sin embargo, no puedes ser un buen ingeniero electrónico si trabajas en una caja negra. Algunas ideas sobre las preguntas audaces y sus respuestas son parte intrínseca de la selección de componentes y el rendimiento del dispositivo resultante.
JYelton
8
Esta es una pregunta relevante y no debe cerrarse
Andy, también conocido como

Respuestas:

23

Considera esto: -

ingrese la descripción de la imagen aquí

El nivel de sonido se mide en dB y un aumento / disminución de 10 dB en la señal equivale a una duplicación / reducción a la mitad del volumen percibido por el oído / cerebro.

Mire la imagen de arriba y pregúntese cuál es la mejor opción para un controlador de volumen suave (junto con un extenso). A continuación se muestran las curvas de Fletcher Munson que muestran la gama completa de decibelios que un humano puede escuchar cómodamente. Tenga en cuenta que, a menos que su sistema estéreo sea muy potente, un rango de 100 dB es "correcto" para el control de volumen. Las curvas de Fletcher Munson también relacionan el volumen con el tono de un sonido. Tenga en cuenta también que todas las curvas están normalizadas a 1 kHz en pasos de 10 db: -

ingrese la descripción de la imagen aquí

¡Aproximadamente cada 10% de recorrido del limpiaparabrisas en el potenciómetro LOG puede reducir / aumentar el volumen en 10 dB, mientras que una olla LIN deberá moverse hasta su posición media antes de reducir el volumen en solo 6 dB! Cuando una olla lineal está cerca del extremo inferior de su recorrido (menos del 1% del movimiento restante), estará haciendo saltos masivos en atenuación de dB por solo un pequeño movimiento, por lo tanto, sería muy difícil establecer el volumen con precisión en un nivel bajo.

También vale la pena señalar que un pot LOG solo es capaz de hacer frente a un rango dinámico de ajuste antes de hacer lo mismo (por debajo de -100 dB), pero el punto es que esto apenas se notará en el extremo pequeño y silencioso de su viaje

También puede notar que las marcas en una olla como CW y CCW le dicen qué extremo de una olla es el extremo del suelo y el extremo de alto volumen. CW = en sentido horario y CCW son puntos finales en sentido antihorario para el limpiador.

Andy alias
fuente
1
Además, los faders lineales profesionales usan un "cono de audio" que no es ni log ni lin, para darle más control cerca del "cero nominal" donde se necesita un ajuste fino.
Jon Watte
@ Jon: ¿Podría ser porque la relación de percepción descrita, parafraseada como "un aumento de diez veces en intensidad es una duplicación de la intensidad percibida", es en realidad una curva de potencia, no exponencial-logarítmica? Es decir, no l o u d n e s s log ( i n t e n s i t y )
loudnessintensity0.3
loudnesslog(intensity)
Ben Voigt
@BenVoigt, si esto es de lo que se trata, podríamos haberlo aclarado mucho antes. Vea la 2da adición a mi respuesta.
Alfred Centauri
No, es porque a los ingenieros de mezcla les gusta obtener el nivel más o menos al principio de la cadena, y luego afinar los tallos más prominentes con una mejor resolución. ¡Es completamente una cuestión de ergonomía AFAIK!
Jon Watte
@ JonWatte Desea ajustar la ganancia aproximadamente correcta en la etapa más temprana para maximizar el rango dinámico. Cada etapa agrega ruido, por lo que aumentar la ganancia más adelante también aumentará el ruido agregado. (O hacer una gran cantidad de atenuación en una etapa posterior permitirá etapas anteriores a CLIP)
endolito
15

¿Qué significa que el oído humano no es lineal?

En este contexto, si el oído humano fuera lineal, una onda de sonido con el doble de potencia que otra sonaría el doble de fuerte.

Sin embargo, el hecho es que una onda de sonido debe tener 10 veces el poder de otra para sonar el doble de fuerte.

¿Cómo se relacionan los cambios de registro en la resistencia de la olla con las ondas de sonido y cómo funciona el oído humano?

Suponga que el potenciómetro ( control de volumen ) varía la potencia de la señal aplicada al altavoz y suponga que el amplificador puede producir un máximo de 100W.

Suponga que el potenciómetro es lineal, el control está marcado de manera uniforme de 1 a 100 y comenzamos con el control establecido en 100: se envían 100 W de potencia al altavoz.

Para reducir a la mitad el volumen, reduciríamos la salida a 10W, lo que requeriría girar el control de volumen 90% CCW a la marca "10" .

Para reducir a la mitad el volumen nuevamente, querríamos solo 1W, lo que requeriría girar el control de volumen a la marca "1" .

Para reducir a la mitad el volumen nuevamente, querríamos solo 0.1W y ... ¿ve el problema?

Sin embargo, si el bote fuera logarítmico, el espacio en la perilla entre 0.1W y 1W, 1W y 10W, y 10W y 100W sería el mismo . Si hubiera diez marcas, espaciadas uniformemente, tendríamos algo como:

0, 1mmw, 10mmw 100mmw, 1mW, 10mW, 100mW, 1W, 10W, 100W

Así que pasamos de ningún sonido a apenas audible, el doble, el doble, el doble, el doble, etc.


Este apéndice es para abordar una pregunta planteada en el hilo de comentarios bastante largo. Según @BenVoigt, el atenuador hipotético propuesto anteriormente no ajusta el nivel de sonido de manera uniforme.

@Alfred: repetiré mi comentario anterior, ya que claramente lo pasó por alto: "su dial tiene" volumen 1, 2, 4, 8, 16, 32 ... 1024 "como sus tics igualmente espaciados. Un clic en la parte inferior es un cambio de 1 unidad de volumen. Un clic en la parte superior es un cambio de 512 unidades de volumen ". 1 y 512 son cambios muy diferentes.

Como no he podido convencer a Ben de su error ni Ben ha podido convencerme del mío en el hilo de comentarios, me gustaría abordar esta disputa en este apéndice.

Según esta fuente , la diferencia notable en la intensidad del sonido es de aproximadamente 1 dB:

aproximadamente 1 decibel es la diferencia notable (JND) en la intensidad del sonido para el oído humano normal.

Si la intensidad del sonido cambia en 1dB, solo notamos el cambio en el volumen.

Por lo tanto, se deduce que si nuestro hipotético atenuador escalonado ajustara la atenuación en incrementos de 1dB, ajustar el control en 1 paso haría que el sonido sea notablemente más fuerte o más suave para el oído humano.

En otras palabras, este atenuador ajustaría suavemente el volumen del sonido , en incrementos notables, en todo el rango.

Entonces, en lugar de 10 pasos espaciados uniformemente como di anteriormente, imagine 100 pasos espaciados uniformemente en el control.

Cada paso cambia el poder en 1dB; girando el control CW 1 paso aumenta la potencia en un factor de 1.2589 ...; girando el control CCW 1 paso disminuye la potencia en un factor de 0.79433 ...

Por ejemplo, si el control se configurara con una salida de 1W, girar los 10 pasos del control aumentaría la potencia en a 10W. Afinando el control CW otros 10 pasos aumentaría la potencia en otro factor de 10 a 100W.(1.2589...)10=10

Pero esto difiere del atenuador anterior solo en resolución, es decir, solo hemos aumentado el número de marcas (espaciadas uniformemente) entre las marcas originales.

Además, en el hilo se cuestiona si se trata de un atenuador logarítmico.

Dije explícitamente que la relación que describe no es lineal y no logarítmica, es un poder.

Recordando que la relación implica , si un bote es logarítmico, necesariamente hay una relación de potencia relacionada (o exponencial) implicada.x = 10 yy=log(x)x=10y

Ese hecho es que podemos decir que en el atenuador anterior, el número de pasos necesarios para cambiar la potencia en algún factor es proporcional al logaritmo de ese factor.

Por ejemplo, para cambiar la potencia en un factor de 5, por ejemplo, para aumentar la potencia de 1W a 5W, se requiere girar el control

10log(5)7

7 pasos

Entonces, el número de pasos (o cambio en el ángulo de una olla) es logarítmico en el poder.


Segundo apéndice para abordar otros comentarios.

Según @BenVoigt, las respuestas dadas aquí son engañosas o simplemente erróneas:

Pero me da la impresión general de leer cualquiera de estas respuestas que la resistencia logarítmica invierte la respuesta biológica y luego miro más de cerca las matemáticas descritas y me doy cuenta de que eso no es cierto.

Deseo demostrar que una olla logarítmica es lo que se desea pero no porque invierte la respuesta biológica (que no creo que nadie haya afirmado ni es lo que se desea, como mostraré a continuación).

A partir de la conocida (y aproximada) "regla de oro" que 10 veces la intensidad es percibido como 2 veces el volumen, vamos a escribir la siguiente relación entre la relación de volumen y la relativa intensidad :klk

l=2logk

Claramente, si la intensidad relativa es 10, entonces el volumen relativo es 2 como se desee.lkl

Para nuestro atenuador escalonado de 1 dB, la potencia relativa viene dada por:

k=10n/10

Combinando las dos ecuaciones anteriores, tenemos que el volumen relativo es

l=2n/10

Por lo tanto, para cada paso , el volumen aumenta en un factor de 1.0718 ... o disminuye en un factor de 0.93303 ...

Pero esto es lo que queremos . No queremos que el volumen aumente en una cantidad fija en cada paso, queremos que elvolumen relativo aumente en una cantidad fija en cada paso.

De ahí la necesidad de un atenuador logarítmico.

Alfred Centauri
fuente
Una pregunta secundaria: ¿es "mmw" preferible a μw para microwatts? No he visto esta convención antes.
JYelton
2
@JYelton, "mmw" era preferible en este caso porque era demasiado vago para escribir los caracteres adicionales. ¿Recuerdas el viejo estilo ? μμF=pF
Alfred Centauri
Lo que ha descrito es una relación de poder, no una relación logarítmica. es decir, sonoridad = intensidad <sup> 0.3 </sup> Es una línea recta en un gráfico log-log, mientras que una relación logarítmica forma una línea recta en un gráfico log-linear.
Ben Voigt
@BenVoigt, en mi respuesta, hago dos puntos: (1) la relación entre el volumen percibido y la intensidad del sonido no es lineal (10x la intensidad se percibe como 2x alto) y (2) por lo tanto, un control de volumen lineal sería bastante inútil mientras un volumen logarítmico tiene sentido. No entiendo la conexión entre tus puntos y mi respuesta.
Alfred Centauri
No, el control logarítmico no cancela (o "explica") una no linealidad del tipo que usted describe. ¿Realmente estás afirmando que la gente quiere un rango logarítmico de volumen, y el potenciómetro logarítmico lo proporciona? Tal vez, ya que tu oración final describe una progresión exponencial. Pero me da la impresión general de leer cualquiera de estas respuestas que la resistencia logarítmica invierte la respuesta biológica, y luego miro más de cerca las matemáticas descritas y me doy cuenta de que eso no es cierto.
Ben Voigt
11

Andy ha respondido esto, e insinuó al final que las ollas A-taper (log) no son perfectas. Aquí hay una comparación entre una respuesta de registro ideal y lo que realmente hace un bote de registro comercial real (tomado de aquí ):

ingrese la descripción de la imagen aquí

Es una aproximación lineal por segmentos de dos segmentos al cono de registro ideal (línea discontinua). Crudo, pero hace el trabajo lo suficientemente bien en muchos casos.

Tenga en cuenta también los bits planos al final de incluso la curva lineal pot (B-taper). Es entonces cuando el limpiaparabrisas se acerca a los extremos del recorrido en cualquier dirección.

A menudo en estos días, se implementa el control de volumen electrónico que tiene pasos de atenuación o ganancia de dB constantes.

Aquí hay una hoja de datos de ejemplo para el PGA2320. Tiene una ganancia ajustable de + 31.5dB a −95.5dB en pasos de 0.5dB. Un paso de 0.5dB se considera simplemente perceptible. Es un número de 8 bits para seleccionar el nivel de volumen (255 niveles más silencio). Si intentara simular eso con un DAC multiplicador lineal (MDAC), necesitaría algo así como pasos para obtener una resolución de 0.5dB en el extremo inferior (aproximadamente un DAC de 22 bits).4106

Spehro Pefhany
fuente
Las percepciones de volumen no son del todo logarítmicas, especialmente en un ambiente ruidoso. Un cambio de 3dB en el volumen de una señal que apenas es audible sobre el ruido ambiental puede ser enorme. Además, un cambio de 3dB en un nivel de señal que sea lo suficientemente alto como para distorsionarse puede tener un efecto enorme en el nivel de distorsión. Bajo la premisa de que a la mayoría de las personas no les importan los ajustes finos entre "nada" y "claramente audible", tiene sentido condensar ese rango. Con la premisa de que las personas a menudo quieren cosas lo más ruidosas posible sin demasiada distorsión, tiene sentido ampliar ese rango.
supercat
5

Aunque esta pregunta ha sido respondida adecuadamente, encontré algunas de las respuestas confusas, y esto es algo especial para mí, así que aquí hay un intento de una respuesta más simple:

¿Qué significa que el oído humano no es lineal?

El oído humano percibe la intensidad de manera diferente de cómo es realmente el mundo. En el mundo, el sonido tiene una propiedad llamada "Volumen" (o intensidad del sonido) que percibimos como " Volumen ". Una duplicación en el volumen no produce una duplicación en el volumen, y esto es lo que se conoce como "no lineal".

¿Cómo se relacionan los cambios de registro en la resistencia de la olla con las ondas de sonido y cómo funciona el oído humano?

La idea de usar macetas con forma de cono es que copian más de cerca la percepción de la realidad del oído humano: cuando movemos la maceta en una cantidad fija, queremos percibir la misma cantidad de cambio, independientemente de dónde comenzó la maceta. (dicho sea de paso, el oído humano no es lo único que percibe las cosas de esta manera: la mayor parte de la percepción humana se rige por la llamada Ley de Weber-Fechner , pero la audición es particularmente sensible porque el sonido más fuerte que podemos escuchar cómodamente es aproximadamente 1 millones de veces más fuerte que el sonido más silencioso que podemos escuchar).

Esto funciona bien para los controles de ganancia (incluidos los controles de ganancia como parte de un ecualizador u otro circuito), pero no todo en audio debe ser logarítmico: por ejemplo, los controles de balance / panorámica.

Bjorn Roche
fuente
Esto sería más fácil de leer si usara bloques de comillas en lugar de bloques de código.
TRiG
Suponiendo que las otras respuestas son correctas sobre una década de intensidad correspondiente a una octava de volumen, entonces "Cuando movemos la olla el doble de alto, queremos percibir el doble de volumen, y las ollas de registro nos dan eso" está mal.
Ben Voigt
3

Con respecto al aspecto perceptivo de la audición: es un hecho que los sonidos parecen más altos en proporción al registro de la intensidad del sonido real, y no directamente linealmente proporcional. Este es un aspecto muy común de toda percepción animal y humana del medio ambiente. Por ejemplo, si tiene dos pesas, una que pesa 1 onza y otra que pesa 2 onzas, puede usar ambas manos y decir que el peso de 2 onzas es más pesado. Sin embargo, si tiene un peso de 1 libra y otro que pesa 1 libra más 1 onza, será muy difícil discriminar la diferencia.

En general, los procesos neurológicos en la percepción están configurados para discriminar las relaciones entre la intensidad de los estímulos y no las diferencias sustractivas. Esto significa que realmente eres sensible a las diferencias sustractivas en el registro de la intensidad de los estímulos. Esto también incluye la visión, donde el ojo y el cerebro se normalizan para el brillo y el contraste promedio del fondo. Y cuando percibimos diferencias, estas son diferencias en relación con el promedio normalizado. Esto implica una característica fundamental de transferencia logarítmica de los órganos sensoriales más los procesos de adaptación temporal en los órganos sensoriales humanos, y también implica respuestas de adaptación y renormalización relacional en las muchas capas de neuronas interconectadas que procesan información en el sistema nervioso.

En la visión, el ojo debe ser capaz de hacer frente a los niveles de luz que van de 10 ^ {- 4} a 10 ^ 6 candelas por metro cuadrado desde un entorno con una noche estrellada a una al mediodía en un día soleado. Entonces, dada esta escala de 10 órdenes de magnitud, no sería razonable representar la señal visual en la retina usando un sistema lineal. (Es como una cámara que requiere más de 32 bits de representación binaria por píxel solo para brillo sin tener en cuenta el color).

El campo de la psicofísica estudia aspectos relacionados con la percepción de estímulos en relación con los estímulos medidos reales. Dos conceptos importantes son las curvas de diferencia notable (JND), que describen cómo la conciencia del umbral de intensidad para el cambio se relaciona con la intensidad de fondo, y la ley de Weber-Fechner que básicamente establece que la mayoría de los procesos perceptivos son sensibles a las relaciones entre la intensidad de los estímulos. .

Se puede ver que los organismos vivos tienen que tener la capacidad de adaptarse al nivel promedio de estímulos ambientales (entradas visuales, auditivas u otras entradas sensoriales (por ejemplo, en un entorno ruidoso que no se active constantemente por cambios menores), pero al mismo tiempo consciente de importantes cambios importantes que podrían ser relevantes para la supervivencia.

Además, cada órgano sensorial y proceso neuronal tiene un rango dinámico limitado de representación, y también un nivel de ruido interno de fondo (aspectos típicos de cualquier canal de comunicación). Tiene sentido que el cerebro intente volver a normalizar las señales de entrada sensoriales para optimizar constantemente la relación señal / ruido de la representación interna, de modo que la probabilidad de detectar cambios relevantes sea mayor. Es similar al problema de representar señales de audio en solo 8 bits: si puede representar con precisión las señales silenciosas, entonces las fuertes saturarán el rango. Por eso se inventó la ley A.

De todos modos, esta es la razón biológica y perceptiva detrás del hecho de que juzgamos la intensidad del sonido en una escala logarítmica.

Ref. 1: Solo concepto de diferencia notable.

Ref. 2: Ley de Weber-Fechner

Ref. 3: Ley A

Robotbugs
fuente
3

Muchos otros han explicado por qué un lin pot no sirve de mucho, como está, como control de volumen, y han discutido las diversas leyes de pot disponibles.

Lo que no se ha mencionado es el efecto sobre la confiabilidad de la ley de registro. Básicamente, la olla es una pista de carbono o plástico conductor, y todo es mecánico. Las macetas no lineales tienen una pista más delgada en un extremo y, por lo tanto, tienden a deteriorarse más con el tiempo.

Hay un "truco" común utilizado en equipos de audio profesional para evitar esto, y permitir el uso de un bote lineal. Una resistencia desde el limpiaparabrisas hasta el suelo de un lin pot "falsifica" la ley de troncos lo suficientemente bien.

Si lo piensa, lo que la gente quiere con un control de volumen es que se vuelven "ruidosos" con el volumen completo (o casi), "medio" en el medio y "silencioso" en la parte inferior. A nadie le preocupa si cada segmento de 10 dB tiene la misma rotación angular.

En la práctica, si tiene una olla lineal de 10k y pone una resistencia a tierra en el limpiador, obtendrá un circuito como este:

esquemático

simular este circuito : esquema creado con CircuitLab

Ahora Ra + Rb = 10k, y una hoja de cálculo es útil para ver la ley (la rotación es 0 para el sentido antihorario y 1 para la carga completa - Rb es solo 10 * rotación. Dejo la "k" ya que todo se normaliza aquí .)

Ley de marihuana

Por experiencia, resulta que algo alrededor de -15dB en el medio (no es tan preciso) se siente bien, y le evita esperar a que lleguen esas ollas especiales (también reduce las líneas en su lista de materiales), y le da un Producto más confiable. (Para eso quieres Rp = ~ 1k3 con un bote de 10k lin.)

Dado que la precisión de la mayoría de las ollas "log" es terrible de todos modos, esto está bien. Si está haciendo una olla de volumen estéreo y le interesan las imágenes (debería), entonces esto también podría ser un poco más preciso, o tal vez sea mejor con un atenuador conmutado.

danmcb
fuente
Buena adición. Sin embargo, quizás una gráfica de la atenuación resultante frente a la posición del bote sería más fácil de leer que los valores de hoja de cálculo sin procesar.
dim
Gracias. Bueno, al final no es tan informativo. Como puede ver, pasa de -25dB u OFF en el último 10% con esta elección de valor. Puede ajustar eso un poco; lo mejor es escuchar y ver qué funciona (es decir, suena) mejor para la aplicación.
danmcb
1

Los sonidos son presión. Como un globo Estás disparando más que un sentimiento sobre el volumen '1' en tu radio, y estás a 10 pies de distancia, luego te mueves a 20 pies de distancia, necesitas subir el dial. La radio es el centro del globo, ¿quieres que un globo de 5 pies se convierta en un globo de 10 pies? El volumen de aire requerido no solo se duplica, ¿verdad? Es mucho más En realidad, para un globo es aproximadamente 8 veces. Pero nuestros cerebros no funcionan así. Cambiando su dial de radio de 1 a 8, solo porque movió 10 pies parecería 'incorrecto'. Entonces, use una olla de registro, luego cámbiela de 1 a aproximadamente 2, y tendrá los dulces sonidos de Boston resonando en sus oídos con el volumen 'correcto'.

Gredoso
fuente
¿No es la onda de sonido una esfera, por qué pelota? Así que 4 veces, no 8. (siempre en un caso simple al aire libre, en el interior es aún menos diferencia)
Alexei Martianov