El sonido y su calidad es algo así como la religión. Historia de nunca acabar.
La gente dirá que MP3 320kbps no tiene pérdidas, mientras que los expertos dirán que cualquier MP3 es una mierda, pero al final, nadie escuchará una diferencia en el resultado ... a menos que estén en la industria de la música durante más de 20 años.
¿Cuál sería el mejor formato para videojuegos y qué propiedades deberían ser suficientes (Hertz, bitrate, etc.), suponiendo que MP3 de 320 kbps sea "pesado"?
Tal vez un ejemplo o dos, cómo algunos títulos AAA funcionan con sus sonidos.
Respuestas:
Actualización de julio de 2017
Si está utilizando Unity u otro gran motor que tiene un sistema de gestión de activos, no solicite a Ogg Vorbis a sus diseñadores y compositores de sonido. Obtenga WAV o AIFF.
Unity y Unreal están estructurados para trabajar con rebotes de alta calidad y luego aplican configuraciones de compresión por plataforma. Tener el recurso fuente como Ogg o Mp3 significa que está comprimiendo dos veces el audio e introduciendo artefactos adicionales sin ningún beneficio.
Si ve que comenzar desde ogg o mp3 reduce su tamaño de construcción, esa no es una buena razón. Probablemente significa que está preexportando con configuraciones de compresión diferentes a las que ha aplicado en Unity / Unreal. ¿Hay excepciones? Sí, pero no estaría buscando esta respuesta si supiera cuándo son aplicables esas excepciones.
Si está precomprimiendo para reducir el tamaño de su repositorio, use LFS, use un sistema de control de versiones centralizado, o sonríe y aguante.
TL; DR
La verdadera respuesta
El audio codificado en MP3, independientemente de la calidad de codificación, siempre tiene pérdidas. Es un códec perceptual y, por lo tanto, funciona codificando las propiedades del sonido a lo largo del tiempo en ~ 1152 fragmentos de muestra en una forma comprimida, desde la cual el decodificador puede extrapolar muestras no comprimidas. Su objetivo no es recrear con precisión el audio original, solo proporcionar uno que sea "suficientemente bueno".
Sin embargo, como dijiste, 320 kbps suena muy bien. En general, se considera que es tan bueno o mejor que la calidad de CD. Sin embargo, todavía no es posible recrear perfectamente las muestras originales de un WAV sin comprimir codificado como MP3 de 320 kbps.
En general, Ogg Vorbis es un mejor formato que el MP3. En general, se acuerda brindarle una mejor calidad para el mismo tamaño de archivo, y a diferencia del MP3, se puede colocar fácilmente sin problemas. Esos fragmentos de 1152 muestras que utiliza MP3 para codificar audio a menudo dejan silencio al principio y al final de un sonido. No es un gran problema para los efectos de sonido básicos, pero es un gran problema para los bucles de música.
El IDE de Flash evita esto durante la exportación .swf, elimina el silencio manualmente. Las personas que usan transmisión de audio (o mxmlc puro) logran bucles a través de SampleDataEvent y sueltan muestras manualmente o preprocesan el archivo MP3 (consulte el blog de Andre Michelle y la utilidad CompuPhase mp3loop )
Además, el uso de un decodificador de MP3 requiere técnicamente que adquiera una licencia de patente para usar (ya que la patente de MP3 es propiedad de Technicolor, Fraunhofer y otros). Obviamente, muchas personas han lanzado juegos gratuitos que utilizan MP3, pero es mejor no perder el tiempo con eso.
Eso depende: ¿Cuáles son sus plataformas objetivo, qué otras tecnologías está utilizando, cómo distribuye su juego y a qué estilo va? Voy a dividir esto en algunas categorías basadas en la plataforma, la tecnología y la estética.
PC de gama alta y títulos de consola
Los juegos AAA buscan una calidad de producción superior, por lo que están grabando y produciendo activos sin comprimir a 24 bits / 48 kHz (también el estándar para la postproducción de películas). Los títulos con ambiciones ligeramente menores que Battlefield 3 podrían grabar y producir en 16 / 44.1, que es el estándar oficial para audio con calidad de CD.
Por supuesto, no puedes enviar un montón de WAV sin comprimir 24/48 con un juego, sería demasiado grande. Entonces, en última instancia, debe haber algún tipo de compresión. En general, la regla general es que, si se trata de un efecto de sonido rápido como el sonido de una pistola (como el disparo del arma Portal 2 en la respuesta de Sprunth), está bien dejarlo como un WAV, posiblemente reduciendo la frecuencia de muestreo dependiendo de la frecuencia (consulte el Teorema de Nyquist , los sonidos que se componen de contenido de baja frecuencia se pueden codificar a frecuencias de muestreo más bajas). Para la música, realmente no hay forma de evitar la compresión. Ogg Vorbis con calidad de CD es el camino a seguir (44.1kHz, calidad 5-6 o superior).
Además, los juegos AAA a menudo usan una herramienta intermedia para la compresión, ya sea una herramienta interna o un middleware de audio como FMOD o Wwise. La forma en que funciona en FMOD y Wwise es que importa la mayoría de las cosas como WAV 16 / 44.1 o 24/48 (o, si el sonido es todo contenido de baja frecuencia, puede importarse con una frecuencia de muestreo más baja), luego le da FMOD un factor de compresión para cada activo, eligiendo una codificación como ADPCM, MP3 u Ogg Vorbis.
FMOD dejó de admitir recientemente la codificación de activos en los bancos de sonido que exporta desde FMOD Designer (archivos .fsb) como Ogg Vorbis a favor de un nuevo códec de Xiph llamado CELT . Ogg Vorbis puede ser un poco duro con la CPU, por lo que CELT se está desarrollando para proporcionar una alternativa. Puede cargar los archivos directamente, pero ya no los usa para codificar desde la aplicación Designer.
Por cierto, aquí hay un enlace genial sobre el audio de Battlefield Bad Company que también entra un poco en surround. DICE está a la vanguardia de la tecnología de audio en los juegos, por lo que es una buena serie para estudiar.
Además, relacionado con el sonido envolvente está el tema mono vs estéreo. En caso de que no lo supiera, todos sus efectos de sonido deberían ser mono, a menos que algunos de ellos realmente utilicen efectos de paneo. Stereo es incómodo de espacializar en un entorno 3D, y puede panoramizar sonidos en código para colocarlos en un entorno 2D.
Títulos ligeramente menos sofisticados, juegos independientes
Obviamente esto puede variar ampliamente. Un vistazo rápido muestra que Frozen Synapse utiliza archivos enteramente Ogg Vorbis, tanto para efectos de sonido como para música. Dungeons of Dredmor, por otro lado, sigue el esquema de Ogg Vorbis para música y 16 / 44.1 WAV para efectos de sonido.
El enfoque de Dungeons of Dredmor es preferible. Incluso almacenados como WAV sin comprimir, los efectos de sonido son generalmente lo suficientemente cortos como para que no ocupen tanto espacio, y ahorra muchos ciclos de CPU sin tener que decodificarlos. Desea poder cargar rápidamente un efecto de sonido en la memoria y reproducirlo. Si codifica sus efectos de sonido en Ogg Vorbis, existe la posibilidad de un pequeño retraso antes de que un jugador escuche su efecto de sonido por primera vez.
Juegos de navegador, HTML5 y Flash (con una pizca de móvil)
El audio HTML5 es un desastre. Tiene que proporcionar versiones de ogg y MP3 de sus sonidos. Codifique con la mayor calidad posible sin que su usuario se enfurezca con el largo tiempo de carga. Para MP3, no bajes de 128k, es suficientemente malo en 128.
Flash solo acepta MP3 de 16 bits / 44.1kHz a menos que se vuelva loco y escriba su propio decodificador para algún otro formato (como el decodificador experimental Ogg Vorbis en los laboratorios de Alchemy). En el pasado, Flash tenía problemas con los MP3 de velocidad de bits variable, pero nunca tuve un problema. La configuración de calidad que elija para su juego Flash dependerá de qué tan grande quiera que sea su .swf final.
Actualización: como mencionó Tetrad , los juegos móviles deben considerarse con memoria y almacenamiento. La forma en que codifica su audio para juegos móviles es muy similar a Flash, desea conservar la mayor calidad posible, pero en última instancia, debe ajustarse a un presupuesto de memoria y almacenamiento. La música de seguimiento es especialmente buena si tienes un presupuesto de almacenamiento ajustado para la música. Dígale a su compositor que limite su paleta de muestra y podrá incluir mucha más música en el juego.
Efectos de sonido y música "8-bit" o tipo Chiptune
La mayoría de los juegos harán lo que hacen Frozen Synapse y Dungeons of Dredmor. Sin embargo, probablemente pueda salirse con la suya reduciendo la frecuencia de muestreo y la profundidad de bits. No solo podría ajustarse a la estética que está buscando, sino que podría ahorrarle algo de espacio.
Además, la música de los rastreadores generalmente almacena muestras a frecuencias de muestreo bajas, solo déjelo pasar.
fuente
Cómo funciona la industria con el sonido, no estoy seguro.
Pero mirando a través de mis juegos, la mayoría de ellos lo envuelven en algún archivo de datos o de otra manera.
Aquí hay algunos bits de audio que podría extraer:
Como no pude descomprimir ninguno de los archivos dat, etc. (excepto el GCF de Portal 2), los resultados pueden no mostrar el espectro en el mercado. Traté de darle una muestra de juegos, y estos que no empaquetan su audio parecen mostrar resultados similares.
fuente
4000 Degrees Kelvin
es del primer portal, no del segundo.En mi experiencia (principalmente títulos móviles), la calidad de audio debe ser lo más baja posible sin efectos secundarios negativos para que tenga más memoria para otras cosas.
Tenga en cuenta que el hecho de que haya compresión implicada no significa necesariamente que su calidad sea demasiado baja. Su audiencia no va a hacer comparaciones lado a lado con los sonidos básicos como usted, por lo que si se están perdiendo algo a través de la compresión con pérdida, generalmente no lo sabrán.
Por ejemplo, debe preguntarse si hay alguna razón para usar sonidos estéreo o música. ¿El efecto que te da vale casi el doble de la sobrecarga? Para la música, dependiendo de cómo esté escrita, la respuesta podría ser sí. Algunos motores ni siquiera admiten fuentes estéreo para efectos de sonido. Ese tipo de cosas.
Donde está esa línea es muy subjetiva, por supuesto. Hay otras respuestas que entran en reglas generales más específicas.
Lo importante es tener estándares, establecerlos temprano e intentar cumplirlos. Si está creando música para un juego y tiene que alcanzar la mitad de su tasa de bits para que quepa en la memoria, entonces estará mucho peor que si establece un nivel de baja calidad en primer lugar.
fuente
Si está apuntando a una plataforma específica (iPhone, Xbox 360, PS3), debe investigar si el hardware tiene un decodificador de audio. Si es así, debes usarlo. Ahorrará tiempo de CPU (¡y duración de la batería!) Al descargar el audio, y podrá aprovechar al máximo las API de esa plataforma. Más importante aún, esa aceleración de hardware dependerá de que su audio esté en un formato específico, por lo que su elección ya estará hecha.
Sin embargo, si está apuntando a PC, sus opciones son más variadas. Simplemente elegiría el formato con el tamaño de archivo más pequeño que todavía suena bien para sus oídos, y lo ejecutaría.
fuente
Depende de lo que va a "oscurecer" la codificación con pérdida: si observa la respuesta de Sprunth, la tendencia general de la música es de alta calidad para el menú y de baja calidad para la música del juego. La razón es probablemente porque:
Finalmente, otra tendencia de sus respuestas es que la mayoría de los efectos son 44KHz / 16bit; pero algunos juegos más antiguos le permitían correr a 22KHz / 16bit ('Calidad de sonido'); en caso de que su tarjeta de sonido no pudiera manejar la frecuencia de muestreo más alta.
fuente