Considere el modelo lineal simple:
donde y , y contiene una columna de constantes.
Mi pregunta es, dado , y , ¿hay una fórmula para un límite superior no trivial en *? (suponiendo que el modelo fue estimado por OLS).
* Supuse, escribiendo esto, que obtener sí mismo no sería posible.
EDITAR1
usando la solución derivada de Stéphane Laurent (ver abajo) podemos obtener un límite superior no trivial en . Algunas simulaciones numéricas (a continuación) muestran que este límite es bastante estricto.
Stéphane Laurent dedujo lo siguiente: donde es una distribución Beta no central con parámetro de no centralidad con
Entonces
donde es un no central χ 2 con el parámetro λ y k grados de libertad. Entonces, un límite superior no trivial para E ( R 2 ) es
es muy ajustado (mucho más apretado de lo que esperaba que fuera posible):
por ejemplo, usando:
rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)
la media de sobre 1000 simulaciones es . El límite superior teórico anterior da . El límite parece ser igualmente preciso en muchos valores de R0.960819
0.9609081
. Realmente asombroso!
EDIT2:
Después de más investigaciones, parece que la calidad de la aproximación del límite superior a mejorará a medida que aumente λ + p (y todo lo demás igual, λ aumenta con n ).
fuente
Respuestas:
Cualquier modelo lineal puede escribirse donde G tiene la distribución normal estándar en R n y se supone que μ pertenece a un subespacio lineal W de R n . En su caso W = Im ( X ) .Y=μ+σG G Rn μ W Rn W=Im(X)
Sea el subespacio lineal unidimensional generado por el vector ( 1 , 1 , ... , 1 ) . Tomando U = [ 1 ] a continuación, el R 2 está altamente relacionado con el estadístico clásico de Fisher F = ‖ P Z Y ‖ 2 / ( m - ℓ )[1]⊂W (1,1,…,1) U=[1] R2
para la prueba de hipótesis deH0:{μ∈U}dondeU⊂Wes un subespacio lineal, y denotando por Z=U⊥∩Wel complemento ortogonal deUenW, y denotandom=dim(W)yℓ=dim(U)
De hecho, porque la definición deR2es R2= ‖ P Z Y ‖ 2
ObviouslyPZY=PZμ+σPZG and
P⊥WY=σP⊥WG .
WhenH0:{μ∈U} is true then PZμ=0 and therefore
In the general situation we have to deal withPZY=PZμ+σPZG when PZμ≠0 . In this general case one has ∥PZY∥2∼σ2χ2m−ℓ(λ) , the noncentral χ2 distribution with m−ℓ degrees of freedom and noncentrality parameter λ=∥PZμ∥2σ2 , and then
F∼Fm−ℓ,n−m(λ) (noncentral Fisher distribution). This is the classical result used to compute power of F -tests.
The classical relation between the Fisher distribution and the Beta distribution hold in the noncentral situation too. FinallyR2 has the noncentral beta distribution with "shape parameters" m−ℓ and n−m and noncentrality parameter λ . I think the moments are available in the literature but they possibly are highly complicated.
Finally let us write downPZμ . Note that PZ=PW−PU . One has PUμ=μ¯1 when U=[1] , and PWμ=μ . Hence PZμ=μ−μ¯1 where here μ=Xβ for the unknown parameters vector β .
fuente