¿Cuál es la importancia de la matriz del sombrero, , en el análisis de regresión?
¿Es solo para un cálculo más fácil?
regression
multiple-regression
least-squares
usuario 31466
fuente
fuente
Respuestas:
En el estudio de la regresión lineal, el punto de partida básico es el proceso de generación de datos donde y determinista. Después de minimizar el criterio de mínimos cuadrados, se encuentra un estimador para , es decir, . Después de conectar el estimador en la fórmula inicial, se obtiene como modelo lineal del proceso de generación de datos. Ahora, uno puede sustituir el estimador pory= XB + u u∼N(0,σ2I) X Bˆ B Bˆ=(X′X)−1X′y yˆ=XBˆ Bˆ y obtieneyˆ=X(X′X)−1X′y.
Entonces, es en realidad una matriz de proyección. Imagine que toma todas las variables en . Las variables son vectores y abarcan un espacio. Por lo tanto, si multiplica por , proyecta sus valores observados en en el espacio que abarcan las variables en . Le da a uno las estimaciones para y esa es la razón por la que se llama matriz de sombrero y por qué tiene tanta importancia. Después de todo, la regresión lineal no es más que una proyección y con la matriz de proyección no solo podemos calcular las estimaciones paraH=X(X′X)−1X′ X H y y X y y pero también para y puede, por ejemplo, verificar si realmente se distribuye normalmente.u
Encontré esta bonita foto en internet y visualiza esta proyección. Tenga en cuenta que se usa lugar de . Además, la imagen enfatiza que el vector de los términos de error es ortogonal a la proyección y, por lo tanto, no está correlacionado con las estimaciones paraβ B y
fuente
La matriz de sombreros es muy útil por algunas razones:
fuente
No es más que encontrar la solución "más cercana" para Ax = b donde b no está en el espacio de la columna de A. Proyectamos b en el espacio de la columna, y resolvemos para Ax (hat) = p donde p es la proyección de b en espacio de columna
fuente