Cuando queremos estimar los parámetros de regresión lineal, hacemos ecuaciones normales, ya que el modelo lineal contiene varias incógnitas. ¿Por qué estas ecuaciones se llaman ecuaciones
Cuando queremos estimar los parámetros de regresión lineal, hacemos ecuaciones normales, ya que el modelo lineal contiene varias incógnitas. ¿Por qué estas ecuaciones se llaman ecuaciones
El título lo dice todo. Entiendo que los mínimos cuadrados y la máxima verosimilitud darán el mismo resultado para los coeficientes de regresión si los errores del modelo se distribuyen normalmente. Pero, ¿qué sucede si los errores no se distribuyen normalmente? ¿Por qué los dos métodos ya no son...
¿Hay alguna manera de obtener un puntaje de confianza (podemos llamarlo también valor de confianza o probabilidad) para cada valor pronosticado cuando se usan algoritmos como Bosques aleatorios o Incremento de gradiente extremo (XGBoost)? Digamos que este puntaje de confianza iría de 0 a 1 y...
He visto en algunos puntos el uso de la derivada Radon-Nikodym de una medida de probabilidad con respecto a otra, especialmente en la divergencia Kullback-Leibler, donde es la derivada de la medida de probabilidad de un modelo para algún parámetro arbitrario con respecto al parámetro real...
En su página wiki , los desarrolladores del estado de Stan: Algunos principios que no nos gustan: invariancia, Jeffreys, entropía En cambio, veo muchas recomendaciones de distribución normal. Hasta ahora utilicé métodos bayesianos que no dependían del muestreo, y me alegré de haber entendido por...
¿Los estimadores de Bayes son inmunes al sesgo de selección? La mayoría de los artículos que discuten la estimación en alta dimensión, por ejemplo, datos de secuencia del genoma completo, a menudo plantean el problema del sesgo de selección. El sesgo de selección surge del hecho de que, aunque...
Como entendí, k-NN es un algoritmo de aprendizaje lento y no necesita una fase de entrenamiento. Entonces, ¿por qué necesitamos usar .fit()con sklearn y qué sucede cuando lo
Basado en lo que he aprendido, utilizamos múltiples filtros en una capa de convección de una CNN para aprender diferentes detectores de características. Pero dado que estos filtros se aplican de manera similar (es decir, deslizados y multiplicados a las regiones de la entrada), ¿no aprenderían los...
Estaba implementando un documento bastante popular " EXPLICANDO Y APROVECHANDO EJEMPLOS ADVERSARIALES " y en el documento, entrena una función objetiva adversaria J '' (θ) = αJ (θ) + (1 - α) J '(θ). Trata a α como un hiperparámetro. α puede ser 0.1, 0.2, 0.3, etc. Independientemente de este...
(Esta pregunta está inspirada en este comentario de Xi'an ). Es bien sabido que si la distribución anterior es adecuada y la probabilidad está bien definida, entonces la distribución posterior es apropiado casi con seguridad.π(θ)π(θ)\pi(\theta)L(θ|x)L(θ|x)L(\theta |
Suponiendo que tengo dos variables aleatorias no independientes y quiero reducir la covarianza entre ellas tanto como sea posible sin perder demasiada "señal", ¿significa centrar la ayuda? Leí en alguna parte que el centrado medio reduce la correlación en un factor significativo, por lo que creo...
Antecedentes En informática, matemáticas y, a veces, en otros campos, los ejemplos "esotéricos" no solo pueden ser entretenidos, sino útiles para ilustrar ciertos conceptos, por ejemplo: Bogosort y Slowsort son algoritmos de clasificación muy ineficientes que pueden usarse para comprender las...
Necesito analizar con R los datos de una encuesta médica (con más de 100 columnas codificadas) que viene en un CSV. Voy a utilizar sonajero para algunos análisis inicial pero detrás de las escenas es todavía R. Si leo el archivo .csv () , las columnas con códigos numéricos se tratan como datos...
Estoy tratando de interpretar el siguiente tipo de modelo logístico: mdl <- glm(c(suc,fail) ~ fac1 + fac2, data=df, family=binomial) ¿Es la salida de predict(mdl)las probabilidades de éxito esperadas para cada punto de datos? ¿Existe una manera simple de tabular las probabilidades para cada...
Si se está probando una hipótesis de homocedasticidad, hay disponibles pruebas paramétricas (prueba de Bartlett de homogeneidad de varianzas bartlett.test) y no paramétricas (prueba de Figner-Killeen de homogeneidad de varianzas fligner.test). ¿Cómo saber qué tipo usar? ¿Debería esto depender, por...
El libro de estadísticas que estoy leyendo recomienda omega al cuadrado para medir los efectos de mis experimentos. Ya probé usando un diseño de parcela dividida (mezcla de diseño dentro de los sujetos y entre sujetos) que mis factores dentro de los sujetos son estadísticamente significativos con p...
Estoy examinando algunos datos de cobertura genómica que son básicamente una larga lista (unos pocos millones de valores) de enteros, cada uno de los cuales dice cuán bien (o "profunda") está cubierta esta posición en el genoma. Me gustaría buscar "valles" en estos datos, es decir, regiones que...
Pregunta: Con una cadena MCMC de 10 dimensiones, digamos que estoy preparado para entregarle una matriz de los sorteos: 100,000 iteraciones (filas) por 10 parámetros (columnas), ¿cómo puedo identificar los modos posteriores? Me preocupan especialmente los modos múltiples. Antecedentes:Me considero...
Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado hace 2 años . Me gustaría aprender a usar Rcpp . Revisé los...
Estoy ajustando un modelo lineal en R usando glmnet. El modelo original (no regularizado) se ajustó utilizando lmy no tenía un término constante (es decir, tenía la forma lm(y~0+x1+x2,data)). glmnettoma una matriz de predictores y un vector de respuestas. He estado leyendo glmnetdocumentación y no...