La página de Wikipedia en R2 dice puede tomar un valor mayor que 1. No veo cómo esto es posible.
Valores de fuera del rango 0 a 1 puede ocurrir donde se usa para medir la concordancia entre los valores observados y modelados y donde los valores "modelados" no se obtienen por regresión lineal y dependiendo de qué formulación de es usado Si se usa la primera fórmula anterior, los valores pueden ser menores que cero. Si se usa la segunda expresión, los valores pueden ser mayores que uno.
Esa cita se refiere a la "segunda expresión" pero no veo una segunda expresión en la página.
¿Hay algún escenario donde puede ser mayor que 1? Estoy pensando en esta pregunta para la regresión no lineal, pero me gustaría obtener una respuesta general.
[Para alguien que mira esta página con la pregunta opuesta en mente: Sí; puede ser negativo Esto sucede cuando ajusta un modelo que se ajusta peor a los datos que una línea horizontal. Esto generalmente se debe a un error al seleccionar un modelo o restricciones.]
fuente
Respuestas:
Encontré la respuesta, así que publicaré la respuesta a mi pregunta. Como señaló Martijn, con la regresión lineal puedes calcularR2 por dos expresiones equivalentes:
Con la regresión no lineal, no puede sumar la suma de cuadrados de los residuos y la suma de cuadrados de la regresión para obtener la suma total de cuadrados. Esa ecuación simplemente no es cierta. Entonces la ecuación anterior no es correcta. Esas dos expediciones calculan dos valores diferentes paraR2 .
La única ecuación que tiene sentido y es (creo) universalmente utilizada es:
Su valor nunca es mayor que 1.0, pero puede ser negativo cuando se ajusta al modelo incorrecto (o restricciones incorrectas) por lo que elSSmi (suma de cuadrados de residuos) es mayor que SSt (suma de cuadrados de la diferencia entre los valores Y reales y medios).
La otra ecuación no se usa con regresión no lineal:
Pero si se usara esta ecuación, da como resultadoR2 mayor que 1.0 en casos donde el modelo se ajusta muy mal a los datos SSmetro Es mas grande que SSt . Esto sucede cuando el ajuste del modelo es peor que el ajuste de una línea horizontal, los mismos casos que conducen aR2 <0 con la otra ecuación.
Línea de fondo:R2 puede ser mayor que 1.0 solo cuando se usa una ecuación no válida (o no estándar) para calcular R2 y cuando el modelo elegido (con restricciones, si corresponde) se ajusta muy mal a los datos, peor que el ajuste de una línea horizontal.
fuente
Por definición,R2=1−SSe/SSt donde ambos términos SS son una suma de cuadrados y, por lo tanto, no negativos. El máximo se alcanza aSSe=0 Resultando en R2=1 .
fuente