¿Puedo probar una relación curvilínea cuando la variable lineal independiente no es significativa?

8

Estoy investigando un efecto curvilíneo entre X e Y utilizando un análisis de regresión jerárquica. Para probar los efectos curvilíneos, se calculó el término al cuadrado para X (quiero decir centro también variable X).

En el modelo 1, se ingresaron las variables de control. En el Modelo 2, se ingresó X (lineal). En el Modelo 3, se ingresó X (cuadrático).

En el Modelo 2, X lineal es significativo. Cuando se ingresa el término cuadrado en el Modelo 3, el término cuadrático es significativo pero el término lineal no lo es. ¿Esto prueba un efecto curvilíneo? ¿O es esencial que en el Modelo 3 ambos (lineal y cuadrático) sean significativos?

Cuando no me refiero a centrar la variable independiente, el Modelo 3 declaró X lineal y X cuadrático significativo. El problema aquí son los problemas de multicolinealidad.

Sanne
fuente

Respuestas:

6

No, no es esencial que los términos lineal y cuadrático sean significativos. Solo el término cuadrático debe ser significativo.

De hecho, es importante tener en cuenta que el término lineal adquiere una interpretación algo diferente en el contexto de un modelo que también incluye el término cuadrático. En dicho modelo, el término lineal ahora representa la pendiente de la línea tangente a x en la intersección con el eje y, es decir, la pendiente pronosticada de x cuando y solo cuando x = 0 . Entonces, una prueba del término lineal en un modelo como este no es, en general, probar lo mismo que en un modelo que solo incluye el término lineal sin el cuadrático.

Jake Westfall
fuente
0

Piensa en lo que significa significancia. Una relación de la forma que sugiere puede caracterizarse como y estimarse empíricamente como .Y=una1X2+una2X+siY^=α1X^2+α2X^+β+ϵ

¿Qué significa la importancia de una estimación, digamos, ? La importancia es Pr (datos | H0), y dada una probabilidad "no significativa", lo que realmente no rechaza es la posibilidad de que el coeficiente realmente sea cero.α2

¿Esto invalida el supuesto de una relación curvilínea? No en mi opinión Más bien, parece sugerir que es realmente cero.una2

Considere el siguiente ejemplo (escrito en Stata).

Primero generamos algunos datos:

set obs 20000
gen x = uniform()
gen control_one = uniform()
gen control_two = uniform()
drawnorm e, m(0) sd(0.5)

Luego especificamos una nueva variable X = x ^ 2 y una relación para una variable de resultado Y

gen Y = control_one+control_two+X+e

(Esto corresponde a un modelo curvilíneo multidimensional en x con coeficiente del término lineal y constante igual a cero).

Luego ejecutamos algunas regresiones:

reg Y control_one control_two
reg Y control_one control_two x
reg Y control_one control_two X x

El término x es significativo en el segundo modelo, pero no en el tercero. Según tengo entendido, esto refleja su experiencia con datos reales.

abaumann
fuente
0

En realidad, no es esencial que ninguno de los términos sea significativo, pero nunca se prueba nada con solo un modelo.

Las estimaciones de coeficientes dadas son estimaciones y proporcionan evidencia. Un coeficiente grande en el término cuadrático proporciona mucha evidencia, un coeficiente pequeño proporciona poca evidencia de una relación curvilínea. El término lineal es irrelevante. Puede ser positivo, negativo, cercano a 0 o lo que sea.

Una gráfica de los datos también proporcionará evidencia de una relación curvilínea.

La significación estadística significa una cosa muy precisa: si , en la población de la que se extrajo esta muestra, el efecto fue realmente 0, ¿hay una probabilidad del 5% de que, en una muestra del tamaño disponible, una estadística de prueba hasta ahora o más lejos de 0 se obtendría.

Peter Flom
fuente
0

Como se señaló, la importancia del término curvilíneo se mantiene por sí misma, independientemente de la importancia del término lineal en la regresión. Si el término lineal es cercano a cero, entonces la curva es una U o una U invertida si es significativa. Si ambos términos son significativos, la línea resultante es más como una colina con una pendiente de aceleración (o desaceleración).

StatisticsDoc Consulting
fuente