¿Cómo puede agregar un segundo IV hacer que el primer IV sea significativo?

64

Tengo lo que probablemente sea una pregunta simple, pero me desconcierta en este momento, así que espero que me puedan ayudar.

Tengo un modelo de regresión de mínimos cuadrados, con una variable independiente y una variable dependiente. La relación no es significativa. Ahora agrego una segunda variable independiente. Ahora la relación entre la primera variable independiente y la variable dependiente se vuelve significativa.

¿Como funciona esto? Probablemente esto esté demostrando algún problema con mi comprensión, pero para mí, pero no veo cómo agregar esta segunda variable independiente puede hacer que la primera sea significativa.

regression multiple-regression power suppressor EvKohl
fuente

44

Este es un tema muy discutido en este sitio. Esto probablemente se deba a la colinealidad. Haga una búsqueda de "colinealidad" y encontrará docenas de hilos relevantes. Sugiero leer algunas de las respuestas a stats.stackexchange.com/questions/14500/…

Macro

3

El posible duplicado de predictores significativos se vuelve no significativo en la regresión logística múltiple . Hay muchos hilos de los cuales este es efectivamente un duplicado, ese fue el más cercano que pude encontrar en menos de dos minutos

Macro

3

Este es el problema opuesto al del hilo que @macro acaba de encontrar, pero los motivos son muy similares.

Peter Flom - Restablece a Monica

3

@Macro, creo que tienes razón en que esto puede ser un duplicado, pero creo que el problema aquí es ligeramente diferente de las 2 preguntas anteriores. El OP no se refiere a la importancia del modelo como un todo, ni a las variables que se vuelven no significativas con IV adicionales. Sospecho que esto no se trata de multicolinealidad, sino de poder o posiblemente supresión.

gung - Restablece a Monica

3

también, @gung, la supresión en un modelo lineal solo ocurre cuando hay colinealidad: la diferencia se trata de interpretación, por lo que "no se trata de multicolinealidad sino de posible supresión" establece una dicotomía engañosa

Macro

78

Aunque la colinealidad (de las variables predictoras) es una posible explicación, me gustaría sugerir que no es una explicación esclarecedora porque sabemos que la colinealidad está relacionada con la "información común" entre los predictores, por lo que no hay nada misterioso o contraintuitivo sobre el lado efecto de introducir un segundo predictor correlacionado en el modelo.

Consideremos entonces el caso de dos predictores que son verdaderamente ortogonales : no hay absolutamente ninguna colinealidad entre ellos. Todavía puede suceder un cambio notable en la importancia.

Designe las variables predictoras y y deje que nombre la predicción. La regresión de frente a no será significativa cuando la variación en alrededor de su media no se reduzca apreciablemente cuando se use como la variable independiente. Cuando que la variación está fuertemente asociado con una segunda variable , sin embargo, la situación cambia. Recuerde que la regresión múltiple de contra y es equivalente a $X_1$ $X_2$ $Y$ $Y$ $X_1$ $Y$ $X_1$ $X_2$ $Y$ $X_1$ $X_2$

Regrese por separado y contra . $Y$ $X_1$ $X_2$
Regrese los residuos contra los residuos . $Y$ $X_1$

Los residuos del primer paso han eliminado el efecto de . Cuando se correlaciona estrechamente con , esto puede exponer una cantidad relativamente pequeña de variación que previamente se había enmascarado. Si esta variación está asociada con , obtenemos un resultado significativo. $X_2$ $X_2$ $Y$ $X_1$

Quizás todo esto se aclare con un ejemplo concreto. Para comenzar, usemos Rpara generar dos variables independientes ortogonales junto con algún error aleatorio independiente : $\varepsilon$

n <- 32
set.seed(182)
u <-matrix(rnorm(2*n), ncol=2)
u0 <- cbind(u[,1] - mean(u[,1]), u[,2] - mean(u[,2]))
x <- svd(u0)$u
eps <- rnorm(n)

(El svdpaso asegura que las dos columnas de la matriz x(que representan y ) son ortogonales, descartando la colinealidad como una posible explicación de cualquier resultado posterior). $X_1$ $X_2$

Luego, cree como una combinación lineal de las y el error. He ajustado los coeficientes para producir el comportamiento contrario a la intuición: $Y$ $X$

y <-  x %*% c(0.05, 1) + eps * 0.01

Esta es una realización del modelo con casos. $Y \sim_{iid} N(0.05 X_1 + 1.00 X_2, 0.01^2)$ $n=32$

Mira las dos regresiones en cuestión. Primero , retroceda contra solamente: $Y$ $X_1$

> summary(lm(y ~ x[,1]))
...
             Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.002576   0.032423  -0.079    0.937
x[, 1]       0.068950   0.183410   0.376    0.710

El alto valor p de 0.710 muestra que es completamente no significativo. $X_1$

A continuación , retroceda contra y : $Y$ $X_1$ $X_2$

> summary(lm(y ~ x))
...
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) -0.002576   0.001678  -1.535    0.136    
x1           0.068950   0.009490   7.265 5.32e-08 ***
x2           1.003276   0.009490 105.718  < 2e-16 ***

De repente, en presencia de , es muy significativo, como lo indican los valores p cercanos a cero para ambas variables. $X_2$ $X_1$

Podemos visualizar este comportamiento mediante una matriz de diagrama de dispersión de las variables , e junto con los residuos utilizados en la caracterización de dos pasos de la regresión múltiple anterior. Debido a que y son ortogonales, los residuos de serán los mismos que y, por lo tanto, no es necesario volver a dibujarlos. Incluiremos los residuos de contra en la matriz de diagrama de dispersión, dando esta cifra: $X_1$ $X_2$ $Y$ $X_1$ $X_2$ $X_1$ $X_1$ $Y$ $X_2$

lmy <- lm(y ~ x[,2])
d <- data.frame(X1=x[,1], X2=x[,2], Y=y, RY=residuals(lmy))
plot(d)

Aquí hay una representación de ello (con un poco de prettificación):

Esta matriz de gráficos tiene cuatro filas y cuatro columnas, que contaré desde la parte superior y de izquierda a derecha.

Aviso:

El diagrama de dispersión en la segunda fila y la primera columna confirma la ortogonalidad de estos predictores: la línea de mínimos cuadrados es horizontal y la correlación es cero. $(X_1, X_2)$
El diagrama de dispersión en la tercera fila y la primera columna exhibe la relación leve pero completamente insignificante reportada por la primera regresión de contra . (El coeficiente de correlación, , es solo ). $(X_1, Y)$ $Y$ $X_1$ $\rho$ $0.07$
El diagrama de dispersión en la tercera fila y la segunda columna muestra la fuerte relación entre y la segunda variable independiente. (El coeficiente de correlación es ). $(X_2, Y)$ $Y$ $0.996$
La cuarta fila examina las relaciones entre los residuos de (regresados contra ) y otras variables: $Y$ $X_2$
- La escala vertical muestra que los residuos son (relativamente) bastante pequeños: no pudimos verlos fácilmente en el diagrama de dispersión de contra . $Y$ $X_2$
- Los residuos están fuertemente correlacionados con ( ). La regresión contra ha desenmascarado este comportamiento previamente oculto. $X_1$ $\rho = 0.80$ $X_2$
- Por construcción, no hay correlación restante entre los residuos y . $X_2$
- Hay poca correlación entre y estos residuos ( ). Esto muestra cómo los residuos pueden comportarse de manera completamente diferente a la propia Así es como puede revelarse repentinamente como un contribuyente significativo a la regresión. $Y$ $\rho = 0.09$ $Y$ $X_1$

Finalmente, vale la pena señalar que las dos estimaciones del coeficiente (ambas iguales a , no lejos del valor previsto de ) coinciden solo porque y son ortogonales. Excepto en experimentos diseñados, es raro que la ortogonalidad se mantenga exactamente. Una desviación de la ortogonalidad generalmente hace que cambien las estimaciones de coeficientes. $X_1$ $0.06895$ $0.05$ $X_1$ $X_2$

whuber
fuente

Entonces, entiendo que

explica la variabilidad que

no tiene. ¿Requiere esto que

sea (más) significativo que

? ¿O puede

hacerse significativo sin importancia de

?

X_{1}

$X_1$

X_{2}

$X_2$

X_{2}

$X_2$

X_{1}

$X_1$

X_{1}

$X_1$

X_{2}

$X_2$

Ronald

@Ronald, creo que las respuestas a sus preguntas son no y sí, respectivamente. Puede averiguarlo modificando el ejemplo en esta respuesta: cambie los coeficientes (0.05 y 0.01) en el modelo y el número de casos (

) para ver qué sucede.

n = 32

$n=32$

whuber

23

Creo que este tema se ha discutido antes en este sitio bastante a fondo, si supiera dónde buscar. Por lo tanto, probablemente agregaré un comentario más adelante con algunos enlaces a otras preguntas, o puedo editarlo para proporcionar una explicación más completa si no puedo encontrar ninguna.

Hay dos posibilidades básicas: en primer lugar, el otro IV puede absorber parte de la variabilidad residual y, por lo tanto, aumentar la potencia de la prueba estadística del IV inicial. La segunda posibilidad es que tenga una variable supresora. Este es un tema muy contrario a la intuición, pero puede encontrar información aquí *, aquí o este excelente hilo de CV .

_{* Tenga en cuenta que necesita leer todo el camino hasta la parte inferior para llegar a la parte que explica las variables supresoras, puede simplemente avanzar hasta allí, pero será mejor leer todo.}

Editar: como prometí, estoy agregando una explicación más completa de mi punto con respecto a cómo el otro IV puede absorber parte de la variabilidad residual y, por lo tanto, aumentar el poder de la prueba estadística del IV inicial. @whuber agregó un ejemplo impresionante, pero pensé que podría agregar un ejemplo complementario que explique este fenómeno de una manera diferente, lo que puede ayudar a algunas personas a comprender el fenómeno con mayor claridad. Además, demuestro que el segundo IV no tiene que estar más fuertemente asociado (aunque, en la práctica, casi siempre será para que ocurra este fenómeno).

Las covariables en un modelo de regresión pueden probarse con pruebas dividiendo la estimación del parámetro por su error estándar, o pueden probarse con pruebas dividiendo las sumas de cuadrados. Cuando se usan SS tipo III, estos dos métodos de prueba serán equivalentes (para obtener más información sobre los tipos de SS y las pruebas asociadas, puede ser útil leer mi respuesta aquí: Cómo interpretar las SS tipo I ). Para aquellos que recién comienzan a aprender sobre los métodos de regresión, las pruebas son a menudo el foco porque parecen más fáciles de entender para las personas. Sin embargo, este es un caso en el que creo que mirar la tabla ANOVA es más útil. Recordemos la tabla ANOVA básica para un modelo de regresión simple: $t$ $F$ $t$

\begin{array}{lllll} Fuente & SS & df & SRA & F \\ X_{1} & \sum ({\hat{y}}_{yo} - \bar{y})^{2} & 1 & \frac{{SS}_{X_{1}}}{{df}_{X_{1}}} & \frac{{SRA}_{X_{1}}}{{SRA}_{r mi s}} \\ Residual & \sum (y_{yo} - {\hat{y}}_{yo})^{2} & norte - (1 + 1) & \frac{{SS}_{r mi s}}{{df}_{r mi s}} \\ Total & \sum (y_{yo} - \bar{y})^{2} & norte - 1 \end{array}

$\begin{array}{lllll} &\text{Source} &\text{SS} &\text{df} &\text{MS} &\text{F} \\ \hline &x_1 &\sum(\hat y_i-\bar y)^2 &1 &\frac{\text{SS}_{x_1}}{\text{df}_{x_1}} &\frac{\text{MS}_{x_1}}{\text{MS}_{\rm res}} \\ &\text{Residual} &\sum(y_i-\hat y_i)^2 &N-(1+1) &\frac{\text{SS}_{\rm res}}{\text{df}_{\rm res}} \\ &\text{Total} &\sum(y_i-\bar y)^2 &N-1 \end{array}$

Aquí es la media de , es el valor observado de para la unidad (por ejemplo, paciente) , es el valor predicho de modelo para la unidad , y es el número total de unidades en el estudio. Si tiene un modelo de regresión múltiple con dos covariables ortogonales, la tabla ANOVA podría construirse así: $\bar y$ $y$ $y_i$ $y$ $i$ $\hat y_i$ $i$ $N$

\begin{array}{lllll} Fuente & SS & df & SRA & F \\ X_{1} & \sum ({\hat{y}}_{X_{1 yo} {\bar{X}}_{2}} - \bar{y})^{2} & 1 & \frac{{SS}_{X_{1}}}{{df}_{X_{1}}} & \frac{{SRA}_{X_{1}}}{{SRA}_{r mi s}} \\ X_{2} & \sum ({\hat{y}}_{{\bar{X}}_{1} X_{2 yo}} - \bar{y})^{2} & 1 & \frac{{SS}_{X_{2}}}{{df}_{X_{2}}} & \frac{{SRA}_{X_{2}}}{{SRA}_{r mi s}} \\ Residual & \sum (y_{yo} - {\hat{y}}_{yo})^{2} & norte - (2 + 1) & \frac{{SS}_{r mi s}}{{df}_{r mi s}} \\ Total & \sum (y_{yo} - \bar{y})^{2} & norte - 1 \end{array}

$\begin{array}{lllll} &\text{Source} &\text{SS} &\text{df} &\text{MS} &\text{F} \\ \hline &x_1 &\sum(\hat y_{x_{1i}\bar x_2}-\bar y)^2 &1 &\frac{\text{SS}_{x_1}}{\text{df}_{x_1}} &\frac{\text{MS}_{x_1}}{\text{MS}_{\rm res}} \\ &x_2 &\sum(\hat y_{\bar x_1x_{2i}}-\bar y)^2 &1 &\frac{\text{SS}_{x_2}}{\text{df}_{x_2}} &\frac{\text{MS}_{x_2}}{\text{MS}_{\rm res}} \\ &\text{Residual} &\sum(y_i-\hat y_i)^2 &N-(2+1) &\frac{\text{SS}_{\rm res}}{\text{df}_{\rm res}} \\ &\text{Total} &\sum(y_i-\bar y)^2 &N-1 \end{array}$

Aquí , por ejemplo, es el valor predicho para la unidadsi su valor observado paraera su valor real observado, pero su valor observado parafue la media de. Por supuesto, es posible queseael valor observado de $\hat y_{x_{1i}\bar x_2}$ $i$ $x_1$ $x_2$ $x_2$ $\bar x_2$ $x_2$ para alguna observación, en cuyo caso no hay que hacer ajustes, pero este no suele ser el caso. Tenga en cuenta que este método para crear la tabla ANOVA solo es válido si todas las variables son ortogonales; Este es un caso altamente simplificado creado con fines expositivos.

Si consideramos la situación en la que se utilizan los mismos datos para ajustar un modelo con y sin , entonces la observada $x_2$ $y$ valores de y serán los mismos. Por lo tanto, el SS total debe ser el mismo en ambas tablas ANOVA. Además, si y son ortogonales entre sí, entonces será idéntico en ambas tablas ANOVA también. Entonces, ¿cómo es que puede haber sumas de cuadrados asociados con en la tabla? ¿De dónde vinieron si el total de SS y $\bar y$ $x_1$ $x_2$ $SS_{x_1}$ $x_2$ $SS_{x_1}$ ¿son lo mismo? La respuesta es que vinieron de . Los también se toman de . $SS_\text{res}$ $\text{df}_{x_2}$ $\text{df}_\text{res}$

Ahora la prueba de es la $F$ $x_1$ dividida poren ambos casos. Como es el mismo, la diferencia en la importancia de esta prueba proviene del cambio en, que ha cambiado de dos maneras: comenzó con menos SS, porque algunos se asignaron a, pero esos son dividido por menos df, ya que algunos grados de libertad también se asignaron a. El cambio en el significado / poder de laprueba(y equivalentemente el $MS_{x_1}$ $MS_\text{res}$ $MS_{x_1}$ $MS_\text{res}$ $x_2$ $x_2$ $F$ -test, en este caso) se debe a cómo se intercambian esos dos cambios. Si se le da más SS a , en relación con el df que se le da a , entonces la disminuirá, lo que hará que la asociada con aumente y vuelva más significativo. $t$ $x_2$ $x_2$ $MS_\text{res}$ $F$ $x_1$ $p$

El efecto de no tiene que ser mayor que para que esto ocurra, pero si no es así, los cambios en los valores serán bastante pequeños. La única forma en que terminará cambiando entre la no significancia y la significación es si los valores son solo ligeramente en ambos lados de alfa. Aquí hay un ejemplo, codificado en : $x_2$ $x_1$ $p$ $p$ R

x1 = rep(1:3, times=15)
x2 = rep(1:3, each=15)
cor(x1, x2)     # [1] 0
set.seed(11628)
y       = 0 + 0.3*x1 + 0.3*x2 + rnorm(45, mean=0, sd=1)
model1  = lm(y~x1)
model12 = lm(y~x1+x2)

anova(model1)
#  ...
#           Df Sum Sq Mean Sq F value  Pr(>F)  
# x1         1  5.314  5.3136  3.9568 0.05307 .
# Residuals 43 57.745  1.3429                  
#  ...
anova(model12)
#  ...
#           Df Sum Sq Mean Sq F value  Pr(>F)  
# x1         1  5.314  5.3136  4.2471 0.04555 *
# x2         1  5.198  5.1979  4.1546 0.04785 *
# Residuals 42 52.547  1.2511                  
#  ...

De hecho, no tiene que ser significativo en absoluto. Considerar: $x_2$

set.seed(1201)
y       = 0 + 0.3*x1 + 0.3*x2 + rnorm(45, mean=0, sd=1)
anova(model1)
# ...
#           Df Sum Sq Mean Sq F value  Pr(>F)  
# x1         1  3.631  3.6310  3.8461 0.05636 .
# ...
anova(model12)
# ...
#           Df Sum Sq Mean Sq F value  Pr(>F)  
# x1         1  3.631  3.6310  4.0740 0.04996 *
# x2         1  3.162  3.1620  3.5478 0.06656 .
# ...

Sin duda, estos no son nada como el dramático ejemplo en la publicación de @ whuber, pero pueden ayudar a las personas a comprender lo que está sucediendo aquí.

gung - Restablece a Monica
fuente

1

(+1) para "Primero, el otro IV puede absorber parte de la variabilidad residual y, por lo tanto, aumentar el poder de la prueba estadística del IV inicial", que @whuber dio un buen ejemplo de

Macro

(+1) Al principio le das tres enlaces. Desafortunadamente, el primero (externo) está roto (error 404). Aparte de eso: usted dice que hay "dos posibilidades básicas": el segundo IV agregado aumenta la potencia para probar el primer IV (y esta es exactamente la situación descrita por Whuber y Wayne en sus respuestas) o hay una variable supresora (¿cuál, por cierto, el primero o el segundo?). Mi pregunta: ¿son realmente dos situaciones distintas? ¿O es esencialmente lo mismo, tal vez visto un poco diferente? Sería genial si pudieras ampliar eso.

ameba dice Reinstate Monica

@amoeba, ttnphns habla de ello aquí: efecto de supresión en regresión: definición y explicación / representación visual , y hablo de supresión aquí: X e Y no están correlacionados, pero X es un predictor significativo de Y en regresión múltiple. Qué significa eso?

gung - Restablece a Monica

@gung, gracias por la respuesta. Ttnphns comienza con un enlace a un documento que discute la supresión y algunos otros efectos relacionados, y este documento afirma que "la definición más generalmente aceptada de una variable supresora (Tzelgov y Henik, 1991) [es]" una variable que aumenta la validez predictiva de otra variable (o conjunto de variables) por su inclusión en una ecuación de regresión ”". Esto suena exactamente como lo que OP preguntó aquí, por eso me confundió que dijeras que podría haber dos razones diferentes .

ameba dice Reinstate Monica

1

@amoeba, el punto es que tienes 2 mecanismos diferentes. Es decir, tiene 2 DAG subyacentes diferentes. La manifestación externa puede ser similar, y el poder adicional puede ser más o menos, pero la razón por la cual la 2da variable ayuda difiere b / c la relación de la 2da variable con x1 e y difiere. Si no está claro, es posible que deba hacer una nueva pregunta; Es difícil hacer demasiado en los comentarios.

gung - Restablece a Monica

17

Parece que la pregunta del OP se puede interpretar de dos maneras diferentes:

Matemáticamente, ¿cómo funciona OLS, de modo que agregar una variable independiente puede cambiar los resultados de una manera inesperada?
¿Cómo puede modificar mi modelo agregando una variable cambiar el efecto de otra variable independiente en el modelo?

Ya hay varias buenas respuestas para la pregunta # 1. Y la pregunta # 2 puede ser tan obvia para los expertos que asumen que el OP debe estar haciendo la pregunta # 1 en su lugar. Pero creo que la pregunta # 2 merece una respuesta, que sería algo así como:

Comencemos con un ejemplo. Digamos que tenía las alturas, la edad, el género, etc., de varios niños, y quería hacer una regresión para predecir su altura.

Comienzas con un modelo ingenuo que usa el género como la variable independiente. Y no es estadísticamente significativo. (Cómo podría ser, estás mezclando niños de 3 años y adolescentes).

Luego agrega la edad y de repente no solo la edad es significativa, sino también el género. ¿Cómo es posible?

Por supuesto, en mi ejemplo, puedes ver claramente que la edad es un factor importante en la altura de un niño / adolescente. Probablemente el factor más importante sobre el que tiene datos. El género también puede importar, especialmente para niños mayores y adultos, pero el género solo es un modelo pobre de la altura de un niño.

La edad más el género es un modelo razonable (aunque, por supuesto, simplificado) que es adecuado para la tarea. Si agrega otros datos (interacción de edad y género, dieta, estatura de los padres, etc.), podría hacer un modelo aún mejor, que por supuesto aún se simplificaría en comparación con la gran cantidad de factores que realmente determinan la estatura de un niño, pero, de nuevo, todos los modelos son versiones simplificadas de la realidad. (Un mapa del mundo con escala 1: 1 no es demasiado útil para un viajero).

Su modelo original (solo género) está demasiado simplificado, tan simplificado que está esencialmente roto. Pero eso no significa que el género no sea útil en un modelo mejor.

EDITAR: sugerencia agregada de gung re: el término de interacción de edad y género.

Wayne
fuente

1

Presumiblemente, +1, nb, edad y género también necesitarán un término de interacción.

gung - Restablece a Monica

1

+1 Ese es un gran ejemplo porque es muy simple e intuitivamente claro, y al mismo tiempo se ajusta exactamente a la situación descrita con mucho más detalle pero solo de manera abstracta por @whuber en su respuesta aceptada aquí.

ameba dice Reinstate Monica

10

Este hilo ya tiene tres respuestas excelentes (+1 a cada una). Mi respuesta es un comentario extenso e ilustración al punto hecho por @gung (que me tomó un tiempo entender):

Hay dos posibilidades básicas: en primer lugar, el otro IV puede absorber parte de la variabilidad residual y, por lo tanto, aumentar la potencia de la prueba estadística del IV inicial. La segunda posibilidad es que tenga una variable supresora.

$x_1$ $x_2$ $y$ $n$ $\mathbb R^n$ $\mathbf y$ $\mathbf x_1$ $\mathbf x_2$ (con la "matriz del sombrero" simplemente como un proyector). Los lectores que no estén familiarizados con este enfoque pueden buscar, por ejemplo, en The Elements of Statistical Learning , Sección 3.2, o en muchos otros libros.

"Mejora"

La siguiente figura muestra ambas posibilidades enumeradas por @gung. Considere solo la parte azul al principio (es decir, ignore todas las líneas rojas):

Mejora y supresión

$\mathbf x_1$ $\mathbf x_2$ $X$ $\mathbf y$ $\hat y$

$\mathbf x_2$ $\mathbf y$ $\mathbf x_1$ $\alpha$ $90^\circ$ $y$ $x_1$ $x_1$ por lo tanto, no es significativo.

$x_2$ $\mathbf x_1$ $\mathbf x_2$ $x_1$ $x_2$ $x_2$ $y$ $\beta$ $\alpha$ $90^\circ$ $x_1$

Otra forma de decirlo es que la prueba ahora compara la longitud de OF con OG, y no con OC como antes; OF es pequeño e "insignificante" en comparación con OC, pero lo suficientemente grande como para ser "significativo" en comparación con OG.

Esta es exactamente la situación presentada por @whuber, @gung y @Wayne en sus respuestas. No sé si este efecto tiene un nombre estándar en la literatura de regresión, por lo que lo llamaré "mejora".

Supresión

$\alpha=90^\circ$ $\beta=90^\circ$ $x_1$ solo fue exactamente cero, se mantendrá exactamente cero.

No es así en la supresión.

$x_3$ $x_1$ $x_2$ $\mathbf x_3$ $X$ $\mathbf x_1$ $x_3$ $x_1$ $X$ $\mathbf y$

$x_1$ $x_1$ $y$

ameba dice Reinstate Monica
fuente

1

Descubrí que tu respuesta es la más fácil de entender con la ayuda de la interpretación geométrica. ¡Soberbio!

zsljulius

1

α = 0

$\alpha=0$

y

$y$

x_{1}

$x_1$

y

$y$

x_{1}

$x_1$

c o r (x_{1}, y) = 1

$cor(x_1,y)=1$

x_{1}

$x_1$

y

$y$

y

$y$

x_{1}

$x_1$

qoheleth

α = 90

$\alpha=90$

¿Cómo puede agregar un segundo IV hacer que el primer IV sea significativo?

Respuestas:

"Mejora"

Supresión