¿Es el coeficiente de correlación de la muestra un estimador imparcial del coeficiente de correlación de la población?

14

¿Es cierto que es un estimador imparcial para ? Es decir, ρ X , Y E [ R X , Y ] = ρ X , Y ?RX,YρX,Y

E[RX,Y]=ρX,Y?

Si no, ¿qué es un estimador imparcial para ? (¿Quizás haya un estimador imparcial estándar que se usa? Además, ¿es análogo a la varianza muestral imparcial, donde simplemente hacemos el ajuste simple de multiplicar la varianza muestral sesgada por ?)nρX,Ynn1

El coeficiente de correlación de población se define como mientras que el coeficiente de correlación de la muestra se define comoRX,Y= n i = 1 (Xi- ˉ X )(Yi- ˉ Y )

ρX,Y=mi[(X-μX)(Y-μY)]mi[(X-μX)2]mi[(Y-μY)2],
RX,Y=i=1n(XiX¯)(YiY¯)i=1n(XiX¯)2i=1n(YiY¯)2.
Kenny LJ
fuente
Una pregunta (un poco similar) sobre estimadores de ρ .
ttnphns
La pregunta "cuál es el estimador imparcial" presupone que hay uno y que solo hay uno. A priori , no parece haber ninguna razón para pensar eso.
Michael Hardy
@MichaelHardy: lo he corregido. Gracias por señalar
Kenny LJ
Me topé con este hilo, y creo que esta podría ser una lectura interesante sciencedirect.com/science/article/pii/S0167715298000352 (aún no lo he leído yo mismo)
Martn
Estimador imparcial de varianza mínima: projecteuclid.org/euclid.aoms/1177706717
Sextus Empiricus

Respuestas:

10

Esta no es una pregunta fácil, pero algunas expresiones están disponibles. Si está hablando de la distribución Normal en particular, ¡entonces la respuesta es NO ! Tenemos

Eρ^=ρ[1(1ρ2)2n+O(1n2)]

como se ve en el Capítulo 2 de la Teoría de la estimación puntual de Lehmann. Hay infinitos términos en la expresión anterior, pero esencialmente estamos considerando términos de orden igual o inferior a insignificante.n2

Esta fórmula muestra que el coeficiente de correlación de la muestra solo es imparcial para , es decir, independencia, como cabría esperar. También es imparcial para los casos degenerados con , pero eso no es muy interesante. En casos generales, el sesgo será de orden pero bastante pequeño para todos los tamaños de muestra razonables.ρ=0|ρ|=11n

En distribuciones normales, el coeficiente de correlación de la muestra es el mle, lo que significa que es asintóticamente imparcial. También puede ver eso en la fórmula anterior como . Tenga en cuenta que esto ya se desprende de la delimitación y la consistencia del coeficiente de correlación de la muestra a través del teorema de convergencia acotada.Eρ^ρ

JohnK
fuente
2
Puede haber infinitos términos en la expresión anterior, pero "términos infinitos" serían algunos términos, cada uno de los cuales es infinito.
Michael Hardy
Suponga que todos los puntos en una población bivariada se encuentran en una línea recta con pendiente distinta de cero. Entonces todos los puntos en cualquier muestra también lo hacen. Por lo tanto, supongo que si la correlación de la población tiene un valor absoluto así que también muestra la correlación . |ρ|=1|r|1
Nick Cox
@NickCox Eso es cierto, en el caso degenerado, el coeficiente de correlación de la muestra devolveríaSin error de estimación. |1|
JohnK
Para una pregunta relacionada, ¿alguien sabe si existen resultados análogos para otras distribuciones además de la normal 2D?
Riemann1337