Entiendo que no puede ser negativo ya que es el cuadrado de R. Sin embargo, ejecuté una regresión lineal simple en SPSS con una sola variable independiente y una variable dependiente. Mi salida SPSS me da un valor negativo para . Si tuviera que calcular esto a mano desde R, entonces sería positivo. ¿Qué ha hecho SPSS para calcular esto como negativo?
R=-.395
R squared =-.156
B (un-standardized)=-1261.611
Código que he usado:
DATASET ACTIVATE DataSet1.
REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10) /NOORIGIN
/DEPENDENT valueP /METHOD=ENTER ageP
Me sale un valor negativo. ¿Alguien puede explicar lo que esto significa?
Respuestas:
Ejemplo: ajustar los datos a un modelo de regresión lineal restringido para que la intersección en igual a .Y 1500
El modelo no tiene ningún sentido dado estos datos. Es claramente el modelo equivocado, quizás elegido por accidente.
El ajuste del modelo (una línea recta restringida para pasar por el punto (0,1500)) es peor que el ajuste de una línea horizontal. Por lo tanto, la suma de cuadrados del modelo es mayor que la suma de cuadrados de la línea horizontal . se calcula como . Cuando es mayor que , esa ecuación calcula un valor negativo para .(SSreg) (SStot) R2 1−SSregSStot SSreg SStot R2
Con una regresión lineal sin restricciones, debe ser positivo (o cero) e igual al cuadrado del coeficiente de correlación, . Un negativo solo es posible con regresión lineal cuando la intersección o la pendiente están restringidas de modo que la línea de "mejor ajuste" (dada la restricción) se ajusta peor que una línea horizontal. Con la regresión no lineal, el puede ser negativo siempre que el modelo de mejor ajuste (dada la ecuación elegida y sus restricciones, si las hay) se ajusta peor a los datos que una línea horizontal.R2 r R2 R2
En pocas palabras: un negativo no es una imposibilidad matemática o el signo de un error informático. Simplemente significa que el modelo elegido (con sus restricciones) se ajusta muy mal a los datos.R2
fuente
¿Has olvidado incluir una intercepción en tu regresión? No estoy familiarizado con el código SPSS, pero en la página 21 de la Econometría de Hayashi:
Verificaría y me aseguraría de que SPSS incluya una intercepción en su regresión.
fuente
NOORIGIN
significaría que la intercepción no estaba incluida en el modelo, simplemente dejando de lado el nombre.Esto puede suceder si tiene una serie temporal que es Niid y construye un modelo ARIMA inapropiado de la forma (0,1,0), que es un modelo de caminata aleatoria de primera diferencia sin deriva y luego la varianza (suma de cuadrados - SSE) de los residuos será mayor que la varianza (suma de cuadrados SSO) de la serie original. Por lo tanto, la ecuación 1-SSE / SSO arrojará un número negativo ya que SSE supera a SSO. Hemos visto esto cuando los usuarios simplemente se ajustan a un modelo asumido o usan procedimientos inadecuados para identificar / formar una estructura ARIMA apropiada. El mensaje más grande ES que un modelo puede distorsionar (al igual que un par de anteojos malos) su visión. Sin tener acceso a sus datos, de lo contrario tendría un problema para explicar sus resultados defectuosos. ¿Ha traído esto a la atención de IBM?
Harvey Motulsky ha hecho eco de la idea de que un modelo asumido es contraproducente. Gran post Harvey!
fuente