¿Cuáles son los estimadores de máxima verosimilitud para los parámetros de la distribución t de Student? ¿Existen en forma cerrada? Una búsqueda rápida en Google no me dio ningún resultado.
Hoy estoy interesado en el caso univariante, pero probablemente tendré que extender el modelo a múltiples dimensiones.
EDITAR: en realidad estoy principalmente interesado en los parámetros de ubicación y escala. Por ahora puedo suponer que el parámetro de grados de libertad es fijo, y posiblemente usar algún esquema numérico para encontrar el valor óptimo más adelante.
Respuestas:
La forma cerrada no existe para T, pero un enfoque muy intuitivo y estable es a través del algoritmo EM. Ahora, dado que el alumno es una mezcla a escala de normales, puede escribir su modelo como
donde y w i ∼ G a ( νei|σ,wi∼N(0,σ2w−1i) . Esto significa que condicionalmente enwithe mle son solo la media ponderada y la desviación estándar. Este es el paso "M"wi∼Ga(ν2,ν2) wi
sigma 2=Σiwi(yi - μ )2
Ahora el paso "E" reemplaza con su expectativa dada toda la información. Esto se da como:wyo
así que simplemente repite los dos pasos anteriores, reemplazando el "lado derecho" de cada ecuación con las estimaciones de los parámetros actuales.
Esto muestra muy fácilmente las propiedades de robustez de la distribución t, ya que las observaciones con grandes residuos reciben menos peso en el cálculo de la ubicación , y la influencia limitada en el cálculo de σ 2 . Por "influencia acotada" quiero decir que la contribución a la estimación para σ 2 de la i-ésima observación no puede exceder un umbral dado (esto es ( ν + 1 ) σ 2 o l d en el algoritmo EM). También ν es un parámetro de "robustez" en el sentido de que aumentar (disminuir) ν dará como resultado más (menos) pesos uniformes y, por lo tanto, más (menos) sensibilidad a los valores atípicos.μ σ2 σ2 ( ν+ 1 ) σ2o l d ν ν
Una cosa a tener en cuenta es que la función de probabilidad de registro puede tener más de un punto estacionario, por lo que el algoritmo EM puede converger a un modo local en lugar de un modo global. Es probable que los modos locales se encuentren cuando el parámetro de ubicación se inicia demasiado cerca de un valor atípico. Entonces, comenzar en la mediana es una buena manera de evitar esto.
fuente
El siguiente documento aborda exactamente el problema que publicó.
Liu C. y Rubin DB 1995. "Estimación ML de la distribución t usando EM y sus extensiones, ECM y ECME". Statistica Sinica 5: 19–39.
Proporciona una estimación general de parámetros de distribución t multivariada, con o sin el conocimiento del grado de libertad. El procedimiento se puede encontrar en la Sección 4, y es muy similar a la probabilidad de lógica para 1 dimensión.
fuente
fuente
Recientemente descubrí un estimador de forma cerrada para la escala de la distribución t de Student. Que yo sepa, esta es una nueva contribución, pero agradecería cualquier comentario que sugiera resultados relacionados. El artículo describe el método en el contexto de una familia de distribuciones "exponenciales acopladas". La t de Student se conoce como la gaussiana acoplada, donde el término de acoplamiento es el recíproco del grado de libertad. La estadística de forma cerrada es la media geométrica de las muestras. Suponiendo un valor del acoplamiento o grado de libertad, una estimación de la escala se determina multiplicando la media geométrica de las muestras por una función que involucra el acoplamiento y un número armónico.
https://arxiv.org/abs/1804.03989 Uso de la media geométrica como estadística para la escala de las distribuciones gaussianas acopladas, Kenric P. Nelson, Mark A. Kon, Sabir R. Umarov
fuente