El proceso exponencial univariante de Hawkes es un proceso de puntos autoexcitante con una tasa de llegada de eventos de: λ(t)=μ+∑ti<tαe−β(t−ti)λ(t)=μ+∑ti<tαe−β(t−ti) \lambda(t) = \mu +
El proceso exponencial univariante de Hawkes es un proceso de puntos autoexcitante con una tasa de llegada de eventos de: λ(t)=μ+∑ti<tαe−β(t−ti)λ(t)=μ+∑ti<tαe−β(t−ti) \lambda(t) = \mu +
La estimación de parámetros usando la estimación de máxima verosimilitud (MLE) implica evaluar la función de verosimilitud, que mapea la probabilidad de que la muestra (X) ocurra con los valores (x) en el espacio de parámetros (θ) dada una familia de distribución (P (X = x | θ ) sobre los posibles...
Estoy confundido sobre el método de máxima verosimilitud en comparación con, por ejemplo, calcular la media aritmética. ¿Cuándo y por qué la probabilidad máxima produce estimaciones "mejores" que, por ejemplo, la media aritmética? ¿Cómo es esto
¿Cuáles son las ventajas y desventajas de ambos
Estoy tratando de demostrar que la matriz de información observada evaluada en el estimador de máxima verosimilitud débilmente consistente (MLE), es un estimador débilmente consistente de la matriz de información esperada. Este es un resultado ampliamente citado, pero nadie da una referencia o una...
El cálculo bayesiano aproximado es una técnica realmente genial para ajustar básicamente cualquier modelo estocástico, destinado a modelos donde la probabilidad es intratable (por ejemplo, puede tomar muestras del modelo si fija los parámetros pero no puede calcular la probabilidad numérica,...
Trato de reproducirme con optimlos resultados de una regresión lineal simple con glmo incluso nlsfunciones R. Las estimaciones de los parámetros son las mismas, pero la estimación de la varianza residual y los errores estándar de los otros parámetros no son los mismos, particularmente cuando el...
Jeffrey Wooldridge en su Análisis econométrico de la sección transversal y los datos del panel (página 357) dice que el hessiano empírico "no garantiza que sea definitivo positivo, o incluso semidefinido positivo, para la muestra particular con la que estamos trabajando". Esto me parece incorrecto...
¿Cuál es el enfoque frecuente de la historia del voltímetro y sus variaciones? La idea detrás de esto es que un análisis estadístico que apela a eventos hipotéticos tendría que revisarse si luego se supiera que esos eventos hipotéticos no podrían haber tenido lugar como se suponía. La versión de...
Pregunta general Supongamos que tenemos datos de iid , , ... transmiten. Queremos calcular recursivamente la estimación de máxima probabilidad de \ boldsymbol {\ theta} . Es decir, haber calculado \ hat {\ boldsymbol {\ theta}} _ {n-1} = \ underset {\ boldsymbol {\ theta} \ in \ mathbb {R} ^ p}...
Para un problema de inferencia dado, sabemos que un enfoque bayesiano generalmente difiere tanto en la forma como en los resultados de un enfoque fequentista. Los frecuentes (por lo general me incluyen a mí) a menudo señalan que sus métodos no requieren un previo y, por lo tanto, están más "basados...
El fenómeno de 'sobredispersión' en un GLM surge cada vez que usamos un modelo que restringe la varianza de la variable de respuesta, y los datos exhiben una mayor varianza de la que permite la restricción del modelo. Esto ocurre comúnmente cuando se modelan datos de conteo utilizando un Poisson...
En el primer capítulo del libro Algebraic Geometry and Statistical Learning Theory, que habla sobre la convergencia de las estimaciones en diferentes espacios funcionales, menciona que la estimación bayesiana corresponde a la topología de distribución de Schwartz, mientras que la estimación de...
Me pregunto si alguna vez se utilizó la estimación de máxima verosimilitud en las estadísticas. Aprendemos el concepto, pero me pregunto cuándo se usa realmente. Si asumimos la distribución de los datos, encontramos dos parámetros, uno para la media y otro para la varianza, pero ¿realmente lo usa...
Esta pregunta trata sobre la estimación de máxima verosimilitud restringida (REML) en una versión particular del modelo lineal, a saber: Y=X(α)β+ϵ,ϵ∼Nn(0,Σ(α)),Y=X(α)β+ϵ,ϵ∼Nn(0,Σ(α)), Y = X(\alpha)\beta + \epsilon, \\ \epsilon\sim N_n(0, \Sigma(\alpha)), donde es una matriz ( n × p )...
Como parte de la salida de un modelo lineal generalizado, la desviación nula y residual se utilizan para evaluar el modelo. A menudo veo las fórmulas para estas cantidades expresadas en términos de la probabilidad de registro del modelo saturado, por ejemplo: /stats//a/113022/22199 , Regresión...
Esta pregunta se deriva de la pregunta: ¿ cuándo (si alguna vez) es un enfoque frecuentista sustancialmente mejor que un bayesiano? Como publiqué en mi solución a esa pregunta, en mi opinión, si usted es un frecuentista, no tiene que creer / adherirse al principio de probabilidad, ya que a menudo...
Parece haber mucha confusión en la comparación de usar glmnetdentro caretpara buscar una lambda óptima y usar cv.glmnetpara hacer la misma tarea. Se plantearon muchas preguntas, por ejemplo: Modelo de clasificación train.glmnet vs. cv.glmnet? ¿Cuál es la forma correcta de usar glmnet con...
MLE = Estimación de máxima verosimilitud MAP = Máximo a posteriori MLE es intuitivo / ingenuo en el sentido de que comienza solo con la probabilidad de observación dado el parámetro (es decir, la función de probabilidad) y trata de encontrar el parámetro que mejor concuerde con la observación ....
θ^θ^\hat\thetaθ∗θ∗\theta^*nnn∥θ^−θ∗∥‖θ^−θ∗‖\lVert\hat\theta-\theta^*\rVertO(1/n−−√)O(1/n)O(1/\sqrt n)∥Eθ^−θ∗∥‖Eθ^−θ∗‖\lVert \mathbb E\hat\theta - \theta^*\rVert∥Eθ^−θ^∥‖Eθ^−θ^‖\lVert \mathbb E\hat\theta - \hat\theta\rVertO(1/n−−√)O(1/n)O(1/\sqrt{n}) Estoy interesado en los modelos que tienen un...