Usando decibelios en estadísticas

11

Estoy trabajando en un proyecto que implica leer etiquetas RFID y comparar la intensidad de la señal que ve el lector cuando cambia la configuración de la antena (número de antena, posición, etc.). Como parte del proyecto, necesito comparar las configuraciones para ver cuáles son las más efectivas.

Idealmente, podría realizar una prueba t sin emparejar o un ANOVA entre dos posiciones de antena (o MANOVA entre múltiples). Sin embargo, como la respuesta está en decibelios que son logarítmicos, me pregunto cuál es la mejor manera de proceder.

¿Sería mejor convertir los resultados en una escala lineal y luego compararlos usando uno de los métodos que mencioné, o debería usar decibelios tal como están con una prueba estadística diferente para compararlos?

Brian Truman
fuente
2
Tomado la libertad de editar etiquetas. La estadística matemática es en la práctica una etiqueta inútil. La serie logarítmica se refiere a algo bastante diferente con una respuesta discreta.
Nick Cox
1
Como está utilizando pruebas asumiendo una distribución gaussiana, si la distribución de respuestas es "más gaussiana" en dB que en la escala lineal (es decir, los datos originales son aproximadamente logarítmicos normales), tiene sentido permanecer en la escala logarítmica.
Luca Citi
@ NickCox, creo que mathematical-statisticsfunciona bien al solicitar una prueba, la etiqueta correspondiente es sinónimo de la etiqueta anterior.
Richard Hardy
Quizás debería haber dicho "una etiqueta inútil para este tipo de pregunta".
Nick Cox

Respuestas:

5

La posibilidad de transformar depende de en qué escala quieres que se deduzca tu inferencia.

Generalmente, la varianza de una función de no es igual a la función de la varianza de x . Debido a que σ 2 f ( x )f ( σ 2 x ) transformando x con f , luego realizando inferencia estadística (pruebas de hipótesis o intervalos de confianza) en f ( x ) , luego transformando hacia atrás ( f - 1) los resultados de esa inferencia aplicar a x no es válido (ya que tanto las estadísticas de prueba como los IC requieren una estimación de la varianza).xxσf(x)2f(σx2)xff(x)f1x

Basar los IC en variables transformadas + transformación inversa produce intervalos sin las probabilidades de cobertura nominal, por lo que la confianza transformada hacia atrás sobre una estimación basada en no es confianza en una estimación basada en x .f(x)x

Del mismo modo, las inferencias sobre variables no transformadas basadas en pruebas de hipótesis sobre variables transformadas significa que cualquiera de los siguientes puede ser cierto, por ejemplo, al hacer inferencias sobre basadas en alguna variable de agrupación y :xy

  1. difiere significativamente en y , pero f ( x ) no difiere significativamente en y .xyf(x)y

  2. xyf(x)y

  3. xyf(x)y

  4. xyf(x)y

f(x)yxy

Entonces, la pregunta de si transformar esos dB se responde por si te importa dB o dB exponencial.

Alexis
fuente
14

Estrictamente, necesitamos ver sus datos para tener alguna posibilidad de dar consejos definitivos, pero es posible adivinar.

Como dices, los decibelios ya están en una escala logarítmica. Es probable que eso signifique, por una variedad de razones físicas y estadísticas, que es muy probable que se comporten bien al ser aproximadamente aditivas, homoscedásticas y condicionalmente distribuidas simétricamente en los predictores. Pero es posible que pueda dar un argumento físico o de ingeniería de cómo debe variar la respuesta a medida que cambia sus variables de diseño.

t

El mismo tipo de razonamiento generalmente se aplica a otras escalas logarítmicas "pre-transformadas" como el pH o la escala de Richter.

PD: No tengo idea de qué son las etiquetas RFID.

Nick Cox
fuente
44
Las etiquetas de RFID son etiquetas de identificación de radiofrecuencia ... esas cosas en su pasaporte, materiales de biblioteca, tarjeta de crédito desconchada, etc. que hacen posible la identificación basada en tokens de forma inalámbrica.
Alexis
2
Voto negativo que parece aleatorio allí. No tengo muchos motivos para quejarme, ya que tengo varios votos por poco trabajo y no es una gran respuesta. (Podría haber escrito una mejor vista de algunos datos.) Pero el voto negativo es inútil: sin una razón dada, ¡no hay margen para cambiar la opinión de nadie!
Nick Cox
3
¿Yo se, verdad? Yo realmente deseo abajo-votantes dejarían retroalimentación constructiva.
Alexis
3

Bueno, la única forma de responder definitivamente a esta pregunta es mirar algunos datos de decibelios: ¿hay una distribución simple (por ejemplo, distribución gaussiana) que sea un buen modelo para eso? ¿O es el exponencial de los datos un mejor candidato? Supongo que los datos no exponencializados son más gaussianos y, por lo tanto, para que cualquier análisis posterior sea más sencillo, debe usar eso, pero lo dejaré ser su juez.

Estoy en desacuerdo con su análisis propuesto, que consiste en aplicar una prueba de significación a los datos observados de diferentes experimentos (es decir, diferentes posiciones de antena). Al considerar la física de esto, debe haber alguna diferencia, quizás minúscula, quizás sustancial. Pero a priori hay alguna diferencia, por lo tanto, con un conjunto de datos lo suficientemente grande, debe rechazar la hipótesis nula de no diferencia. Por lo tanto, el efecto de una prueba de significación es solo concluir "usted tiene / no tiene un conjunto de datos grande". Eso no parece muy útil.

Más útil sería cuantificar la diferencia entre diferentes posiciones de antena, y quizás también tener en cuenta los costos y beneficios para decidir qué posición se seleccionará. Las diferencias cuantificadas a veces se denominan "análisis del tamaño del efecto"; una búsqueda en la web para eso debería generar algunos recursos. Los costos y beneficios se clasifican en la teoría de la utilidad y la teoría de la decisión; nuevamente una búsqueda encontrará algunos recursos.

Robert Dodier
fuente
2

La escala Decibel (logarítmica) es útil porque la potencia de una señal a menudo se puede describir mediante una serie (variable) (o rango de fluidos) de multiplicaciones.

  • 110
  • 1100
  • 11000
  • etc.

P[mW]=P0(110)L[cm]

Esto es más simple, si expresa el logaritmo de la potencia de la señal, como una función lineal (que, si lo desea, requiere alguna definición sobre la escala absoluta, en este caso 0dB se relaciona con 1 mW)

P[dB]=10(log(P0[mW])L[cm])

Cada vez que tienes un proceso que es multiplicativo como:

XeY

Y

YN(μ,σ2)

Xlog(X)


Espero que su término de error sea multiplicativo así. Es decir: la intensidad de la señal será una suma de muchos términos de error distribuidos normales (por ejemplo, fluctuaciones de temperatura del amplificador, condiciones atmosféricas, etc.) que se producen en el exponente de la expresión para la intensidad de la señal.

yi=exi+ϵi
Sexto empírico
fuente