¿Cómo sumar dos variables que están en escalas diferentes?

9

Si tengo dos variables que siguen dos distribuciones diferentes y tienen diferentes desviaciones estándar ... ¿Cómo necesito transformar dos variables para que, cuando sume, los dos resultados no sean "impulsados" por uno más volátil?

Por ejemplo ... La variable A es menos volátil que la variable B (varía de 0 a 3000) y la variable B va de aquí para allá. 300 a 350.

Si simplemente agrega las dos variables juntas, el resultado obviamente será impulsado por A.

usuario333
fuente

Respuestas:

14

Una práctica común es estandarizar las dos variables, UNA,si , para ubicarlas en la misma escala restando la media de la muestra y dividiendo por la desviación estándar de la muestra. Una vez que haya hecho esto, ambas variables estarán en la misma escala en el sentido de que cada una tiene una media muestral de 0 y una desviación estándar muestral de 1. Por lo tanto, se pueden agregar sin que una variable tenga una influencia indebida debido simplemente a escala.

Es decir, calcular

UNA-UNA¯Sre(UNA),  si-si¯Sre(si)

UNA¯,Sre(UNA)UNA

Macro
fuente
1
¿funcionará esto si las variables no se distribuyen normalmente?
user333
1
la estandarización no tiene nada que ver con la distribución normal: es simplemente un medio para poner las variables en la misma escala. Entonces sí.
Macro
Si divido por sd y no resta la media ... obtendré las mismas volatilidades, pero diferentes rangos, ¿verdad?
user333
Sí, si solo las escala (divida por las desviaciones estándar), entonces ambas terminan con la misma varianza, pero su media y rango serán diferentes.
Macro
@Macro ¿Qué sucede si no tengo datos pero solo tengo datos secuenciales para las variables? Entonces, la suma de dos variables actúa más como un puntaje. Creo que hay algunas implicaciones negativas, como las puntuaciones al principio de la secuencia. ¿Sabes de otra manera?
tintinthong