¿Es un modelo saturado un caso especial de un modelo sobreajustado?

10

Estoy tratando de entender qué es un modelo saturado. AFAIK es cuando tienes tantas características como observaciones.

¿Podemos decir que un modelo saturado es un caso especial de un modelo extremadamente sobreajustado?

Ricardo Cruz
fuente
2
No exactamente: creo que un modelo saturado utilizó todos sus grados de libertad. Depende del modelo lo que esto significa exactamente. En un modelo logarítmico lineal, por ejemplo, incluir todas las interacciones en el modelo lo hace saturado, como df = 0, entonces, pero no está sobreajustado.
tomka
Este tema tiene una buena discusión sobre esto: stats.stackexchange.com/questions/283/what-is-a-saturated-model
DL Dahly

Respuestas:

6

@ Tomka tiene razón. Un modelo saturado se ajusta a tantos parámetros como sea posible para un conjunto dado de predictores, pero si está sobreajustado o no depende del número de observaciones para cada patrón único de predictores. Suponga que tiene un modelo lineal con 100 observaciones de en y 100 en . Entonces, el modelo está saturado pero seguramente no está demasiado ajustado. Pero si tiene una observación de para cada una de el modelo está saturado y tiene un ajuste perfecto, sin duda demasiado ajustado .x = 0 x = 1 E Y = β 0 + β 1 x y x = ( 0 , 1 , 2 , 3 , 4 ) T E Y = β 0 + β 1 x + β 2 x 2 + β 3 x 3 + β 4 x 4yX=0 0X=1miY=β0 0+β1XyX=(0 0,1,2,3,4 4)TmiY=β0 0+β1X+β2X2+β3X3+β4 4X4 4

Cuando las personas hablan de modelos saturados que tienen tantos parámetros como observaciones, como en la página web vinculada y la publicación de CV, están asumiendo un contexto de una observación para cada patrón de predicción. (O tal vez a veces use 'observación' de manera diferente: ¿hay 100 individuos en una tabla de contingencia 2 × 2 100 observaciones de individuos o 4 observaciones de frecuencias celulares?

† No tome "seguramente" y "sin duda" literalmente, por cierto. Es posible para el primer modelo que sea ​​tan pequeño en comparación con que predeciría mejor sin tratar de estimarlo, y viceversa para el segundo. Var Yβ1VarY

Scortchi - Restablece a Monica
fuente
Buen ejemplo de la asignación de x = {0,1} a 100 años, gracias. ¿Diría que esta definición no es precisa entonces: stats.gla.ac.uk/glossary/?q=node/448 ?
Ricardo Cruz
Diría exactamente lo que dije en mi segundo párrafo: está asumiendo ese contexto, y una definición más general aplicable podría ser mejor.
Scortchi - Restablece a Monica