OLS en términos de medias y tamaño de muestra

8

Dado un modelo:

y=β0 0+β1F+tu

Donde es ficticio si es hembra y caso contrario, y es altura en cm. El tamaño de la muestra es en total. Además y . Calcular las estimaciones de los parámetros.F=10 0norteFmimetrounalmi=nortemetrounalmi=100200y¯metrounalmi=175y¯Fmimetrounalmi=165

Mi intento:

Usando la fórmula bien conocida:

β^=(XX)-1Xy
obtengo:
[200100100100]-1[170200165200]

Primero, los elementos en (XX)-1 , dado que X es solo un grupo, hay 100 hembras en la muestra y hay 200 machos y hembras en total. Para Xy , el primer elemento es la "gran media" de 170, y el segundo es solo la media de la muestra de estatura para las mujeres. Ambos están escalados en 200, ya que no "reduje" (XX)-1 .

Es la correcta? Pregunto, porque la solución (al multiplicar) da como resultado algunos (muy) impares números.

Repmat
fuente

Respuestas:

7

El enfoque es correcto, pero hay un ligero error numérico: solo hay mujeres, no . Las alturas medias para hombres y mujeres se pueden convertir en sumas a través de100200

Suma de alturas masculinas=100×175

y

Suma de alturas femeninas=100×165.

Por lo tanto, la suma de todas las alturas es

Suma de todas las alturas=100×175+100×165=200×170,

como se indica en la pregunta. En consecuencia, las ecuaciones normales son

(200100100100)(β^0 0β^1)=(200170100165)

( no en el lado derecho), con solución165200

(β^0 0,β^1)=(175,-10).
whuber
fuente
Qué error más tonto ...
Repmat
1
No lo llamaría tonto. Es algo natural que hacer. Tuve que mirar la pregunta durante un par de minutos antes de que el problema se hiciera evidente ...
whuber
1

Estoy bastante confundido. Que decir ¿Son estos residuos? Si es así, entoncestu

XX =[200100100100]

ya que

X=yβ=[y1β1y2β1...ynorteFβ1ynorteF+1β1ynorteF+2β1...ynortenorteF+nortemetroβ1y1β2y2β2...ynorteFβ2ynorteF+1β2ynorteF+2β2...ynortenorteF+nortemetroβ2]T

=

[11...111...10 00 0...0 011...1]T

Algunos pensamientos:

Dada su ecuación mi opinión debería ser 175 y = -10. Entonces, para la parte masculina y femenina obtienes:β1β2

Fmetro=175(+)-10×0 0+tu=175+tu

FF=175(+)-10×1+tu=165+tu

Ya que puedes usar

β=(XX)-1XTy

para resolver usando el pseudoinverso de Moore-Penrose .β

((XX)-1XT)+β=((XX)-1XT)+[175-10]=y

Ahora contiene:y

y[165F1165F2...165F100175metro1175metro2...175metro100]T

¡Espero eso ayude!

nali
fuente
55
Mientras que los estadísticos usualmente usan bajo el nombre de Error para la parte no explicada del modelo, los economometristas frecuentemente hablan de Error, Choques (transitorios) o Perturbación. Es solo una notación habitual. ϵtu
mugen
1
@nali, ¿puedes agregar un poco a esto? Dados sus números, la solución del sistema no tiene sentido. Y sí, ustedes son los residuos.
Repmat
@Repmat: Actualicé algunas ideas que tenía inicialmente. Espero eso ayude.
nali
@Repmat: Quizás me entendiste mal. X '* y no es [170 82.5] ^ T
nali