¿Qué especificaciones técnicas deben establecerse para la música?

11

Estoy escribiendo la música para un videojuego. En algún momento, tendré que trabajar con los programadores para determinar las especificaciones técnicas de los archivos de audio que les voy a entregar. ¿De qué tipo de detalles vamos a necesitar hablar?

Por ejemplo, algunas preguntas que creo que deberíamos resolver son:

  • ¿En qué formato deben estar los archivos de audio?
    • Sin comprimir? Sin pérdida? ¿Comprimido?
    • ¿Cuál es el equilibrio entre audio de alta calidad y tamaños de archivos pequeños?
  • ¿Qué tan fuerte debe ser la música?
    • ¿Cuál debería ser el nivel de volumen promedio de cada pista?
    • ¿Cuál debería ser el nivel de volumen más alto?
  • ¿Cuál debería ser la distribución de frecuencia?
    • Por ejemplo, ¿debería escribir música que no tenga muchos graves para que se pueda escuchar fácilmente el tono bajo?

¿Las preguntas que pensé son importantes para hacer? ¿Hay alguna otra pregunta que debamos discutir?

Kevin
fuente
Esto parece muy amplio ...
55
Creo que es una gran pregunta, ya que formaría un recurso útil para otros.
Ingeniero
2
Un punto que viene a la mente es la prioridad de los sonidos. Esto es bastante evidente en un juego como Diablo, donde tienes muchos efectos que generan bombardear tus altavoces al mismo tiempo. Para evitar que se convierta en ruido cuando hay mucha acción, debes afinar algunos de los sonidos menos importantes como pasos y ambiente para hacer sonidos importantes como hechizos clave a los que el jugador debe reaccionar notablemente, y subir el volumen de ellos una vez que una pelea ha bajado bastante. También depende de las capacidades del hardware cuántos canales puede usar.
ScrambledRK

Respuestas:

6

Si entiendo correctamente, tienes dos preguntas diferentes aquí:

  1. ¿Qué tipo de consideraciones técnicas (como en la programación) deben establecerse?

  2. ¿Qué tipo de consideraciones técnicas (como en ingeniería de audio) se deben establecer?

Para ambas preguntas, su mejor opción es preguntarle a la persona a cargo. Para el primero, podría ser el programador de audio principal, mientras que para el segundo podría ser el director de audio.

Ahora, supongo que ya que estás preguntando esto aquí, estás en un pequeño equipo sin tales roles, y tu programador probablemente no sabe de qué estás hablando, así que voy a responder con un poco de información general. pautas que podrían funcionar para la mayoría de los proyectos. Pero en cualquier caso, no recomendaría tomar decisiones por su cuenta. Discuta con los otros miembros de su equipo para llegar a una conclusión.

Dicho esto, primero hablemos de algunas consideraciones técnicas (de programación).

  • Por lo general, el formato en el que se distribuirán sus archivos de audio ya está determinado por la plataforma o el motor del juego que está utilizando. Si va a hacer multiplataforma, es probable que cada plataforma tenga directorios de recursos completamente independientes, y las características de los archivos de audio pueden ser diferentes para cada plataforma.

    Por ejemplo, es posible que deba entregar archivos Ogg Vorbis para Android, MP3 o AAC para iOS y WMA para Windows.

    A veces, incluso el formato depende del propósito de cada archivo. Si bien iOS funciona bien con archivos MP3 y AAC para cualquier propósito, PlayStation Mobile requiere MP3 para BGM, pero solo admite PCM sin comprimir o ADPCM de Microsoft.

    Pregúntele a su programador en qué formato deben estar los archivos.

  • La mayoría de las veces, las especificaciones básicas para los archivos ya estarán definidas, así que asegúrese de preguntarle a su programador sobre esto. Por ejemplo, los archivos BGM generalmente se distribuyen en estéreo, mientras que los archivos SFX y de voz generalmente se distribuyen en mono (para que puedan colocarse fácilmente dentro del juego)

  • Para bitrates y otros parámetros, una vez más, generalmente dependen del motor o la plataforma. Si tiene algo de libertad aquí, tenga en cuenta que los datos de sonido suelen ser el componente más importante de un juego, y si el juego se distribuirá a través de descargas digitales, su programador (y sus clientes) le agradecerán si hace que los archivos sean pequeños como sea posible.

    Si va a distribuir en medios físicos, entonces el tamaño máximo de distribución está predeterminado, y tendrá que hacer algunas negociaciones serias con el resto del equipo de creación de contenido.

  • Algunos juegos requieren que tus sonidos (principalmente BGM) sean loopables; otros juegos requieren que sus sonidos tengan restricciones de tiempo estrictas (como los juegos de ritmo). La mayoría de los esquemas de compresión con pérdida agregarán silencio de relleno al principio y al final de la pista, lo que puede romper los bucles y el tiempo estricto. Discuta estos problemas con su programador.

Hay demasiadas formas de comprimir audio, por lo que le recomiendo que envíe una versión maestra de cada archivo de sonido en PCM sin comprimir a 44.1KHz de 16 bits estéreo, y luego use ese archivo para crear los archivos reales para cada plataforma. (De manera óptima, podría crear un script de transformación que se pueda aplicar a cada archivo para no tener que reconvertir cada archivo cada vez que realice un pequeño cambio en el archivo maestro).

Ahora, en términos de consideraciones técnicas (como en ingeniería de audio), lo más probable es que a su programador no le importe, por lo que tendrá más libertad en esta área. Hay algunas cosas que puede hacer para facilitarle la vida a su programador:

  • Todos los sonidos en el juego deberían tener un volumen normalizado. Como mínimo, todos los archivos BGM deben tener el mismo volumen entre ellos y todos los archivos SFX deben tener el mismo volumen entre ellos. No haga que su programador tenga que modificar los volúmenes dentro del código.

  • El código de reproducción es muy limitado y generalmente solo puede hacer amplificación lineal. Debido a esto, entre el volumen alto y bajo, se puede preferir alto, ya que reducir el volumen durante la reproducción generalmente conduce a mejores resultados que amplificarlo. Es difícil decir cuál debería ser el volumen exacto, pero como regla general, cuanto mayor sea la amplitud global pico a pico, mejor usará el rango de muestreo.

    Es posible que desee cargar otros juegos y reproducir sus sonidos en su configuración de volumen máximo y comparar sus sonidos con los de ellos.

  • En términos de ecualización, debo decir que esto realmente depende de qué otros sonidos tendrá tu juego. Además de discutir esto con el director de sonido, es posible que también desee tener en cuenta el hardware de reproducción que utilizará: mientras que las computadoras de escritorio pueden tener una gran variedad de hardware de reproducción, los dispositivos portátiles generalmente tienen altavoces muy pequeños, y es posible que desee compensar eso. Las máquinas Arcade generalmente también tienen requisitos muy diferentes.

Pijama Panda
fuente
Una cosa para señalar, para SFX, odio los archivos estéreo. Necesito combinarlos a mono en el motor para poder colocarlos en el motor de sonido 3D correctamente. Como resultado, todos pueden tener SFX original, por ejemplo, los sonidos foley son mono.
rioki
2

Distingo entre dos situaciones, lo que guardo durante el desarrollo y más tarde (almacenamiento) y lo que pongo en la entrega final.

Para el almacenamiento utilizo la mejor calidad posible, es decir, para el audio, algún formato sin pérdidas. Mientras la compresión no tenga pérdidas, en realidad no importa; WAV o FLAC lo harán. Básicamente estoy de acuerdo con una grabación de 44,1 kHz / 16 bits y el volumen debe ser lo más "natural" posible, por lo que básicamente es una grabación original con una ganancia mínima si es necesario. (Si realmente quiere, puede ir con grabaciones de 96 kHz o 192 kHz). El tamaño realmente no importa, los discos duros no son tan caros y siempre puede arrojar más sobre ese problema. La razón principal es que siempre puede comprimir en un formato con pérdida de uno sin pérdida, pero una vez que solo tiene archivos con pérdida, nunca puede pasar a una calidad más alta.

Para la entrega que es una historia totalmente diferente. Aquí debe tomar algunas decisiones difíciles sobre calidad vs. espacio vs. velocidad. Para SFX pequeños, uso archivos WAV porque se cargan más rápido. La música, por otro lado, importa, por lo que normalmente uso MP3 con velocidad de bits variable. Puede salirse con la suya con archivos de 64 kbps, pero eso es cuestión de gustos. Los sonidos deberían estar básicamente en su volumen natural, aunque equilibrados entre sí. El motor del juego hará los ajustes necesarios, especialmente si estás haciendo algo como el sonido 3D.

rioki
fuente
Sabes que PCM sin comprimir a 44.1KHz estéreo de 16 bits va a aproximadamente 1300kbps, ¿verdad? 320kbps de audio sin comprimir sonará horrible.
Panda Pyjama
Es cierto que me refería principalmente al audio comprimido. El sonido FLAC de 128 kbps es bastante bueno.
rioki
"kbps" como configuración del codificador no tiene sentido para FLAC u otros codificadores sin pérdida. Tamaño vs calidad (sonido) solo tiene sentido en compresión con pérdida. ¿Estás seguro de que es FLAC de lo que estás hablando?
Panda Pyjama
Tienes razón, ese es el programador hablando. La "tasa de bits" se basa en la grabación original. Lo que normalmente haría a 44 kHz, lo cual está bien. Puede obtener anal y hacer grabaciones de 96kHz o 192 kHz.
Cambiaré
1
44KHz, 96KHz y 192KHz son "tasas de muestreo", no "tasas de bits". No es una buena idea confundirlos porque sampling rate * sample size * channel count = bitrate. Es por eso que la tasa de bits para 44.1KHz 16bit estéreo es exactamente 1411200 bits / s. Tendrían que muestrearse 320kbps de sonido estéreo de 16 bits a 10KHz, y por lo tanto mi comentario "sonará horrible".
Panda Pyjama