Intuición detrás de la función de densidad de distribuciones t

12

Estoy estudiando sobre la distribución t de Student y comencé a preguntarme cómo derivaría la función de densidad de distribuciones t (de wikipedia, http://en.wikipedia.org/wiki/Student%27s_t-distribution ):

f(t)=Γ(v+12)vπΓ(v2)(1+t2v)v+12

donde es los grados de libertad y \ Gamma es la función gamma. ¿Cuál es la intuición de esta función? Quiero decir, si miro la función de masa de probabilidad de la distribución binomial, tiene sentido para mí. Pero la función de densidad de distribuciones t no tiene ningún sentido para mí ... no es intuitiva a primera vista. ¿O es la intuición simplemente que tiene una curva en forma de campana y sirve a nuestras necesidades?ΓvΓ

Thnx por cualquier ayuda :)

jjepsuomi
fuente
3
Esta distribución tiene una interpretación geométrica simple (y bonita). De hecho, aunque Student (1908) derivó por primera vez esta forma del PDF a través de una suposición inteligente (apoyada por la simulación de Monte-Carlo), Fisher (c. 1920) la obtuvo por primera vez con un argumento geométrico. La esencia es que describe la distribución de la relación de la altura de a (punto distribuido uniformemente) en la y su radio (distancia desde el eje): en otras palabras, la tangente de su latitud. Se proporciona una cuenta de esto en evolvedmicrobe.com/Literature/GeometricTDistribution.pdf . fν+1
whuber

Respuestas:

9

Si tiene una variable aleatoria normal estándar, , y una variable aleatoria chi-cuadrado independiente con df, entoncesZQν

T=Z/Q/ν

tiene una distribución con df. (No estoy seguro de cómo se distribuye , pero no es ).tνZ/Qt

La derivación real es un resultado bastante estándar. Alecos lo hace de dos maneras aquí .

En cuanto a la intuición, no tengo una intuición particular para la forma funcional específica, pero se puede obtener un sentido general de la forma considerando que la distribución de chi independiente (escalada por ) en el denominador es correcta sesgar:ν

ingrese la descripción de la imagen aquí

El modo está ligeramente por debajo de 1 (pero se acerca a 1 a medida que aumenta df), con alguna posibilidad de valores sustancialmente por encima y por debajo de 1. La variación en significa que la varianza de será mayor que la de . Los valores de sustancialmente por encima de 1 dará lugar a un -valor que está más cerca de 0 que es, mientras que los más sustancialmente inferiores a 1 resultará en un -valor que es además de 0 que es.Q/νtZQ/νtZtZ

Todo esto significa que los valores de serán (i) más variables, (ii) relativamente más altos y (iii) más pesados ​​que lo normal. A medida que aumenta df, se concentra alrededor de 1, y luego estará más cerca de lo normal.tQ/νt

ingrese la descripción de la imagen aquí

(el 'relativamente más alto' da como resultado un pico ligeramente más agudo en relación con la propagación, pero la mayor variación tira del centro hacia abajo, lo que significa que el pico es ligeramente más bajo con una df más baja)

Entonces esa es una intuición sobre por qué la ve como se ve.t

Glen_b -Reinstate a Monica
fuente
1
Fui un poco descuidado en mi explicación. Por supuesto, era la raíz cuadrada de la variable aleatoria distribuida Chi-cuadrado dividida por sus grados de libertad.
Analista
@Analista He hecho lo mismo, más de una vez.
Glen_b -Reinstalar a Mónica el
9

La respuesta de Glen es correcta, pero desde el punto de vista bayesiano también es útil pensar en la distribución t como una mezcla continua de distribuciones normales con diferentes variaciones. Puedes encontrar la derivación aquí:

Student t como mezcla de gaussiano

Creo que este enfoque ayuda a su intuición porque aclara cómo surge la distribución t cuando no conoce la variabilidad exacta de su población.

Erik
fuente
2
He hecho una animación de la distribución t como una mezcla de distribuciones normales aquí: sumsar.net/blog/2013/12/t-as-a-mixture-of-normals
Rasmus Bååth