Tengo algunos datos que parecen trazar una gráfica de residuos frente al tiempo casi normal, pero quiero estar seguro. ¿Cómo puedo comprobar la normalidad de los residuos de
Tengo algunos datos que parecen trazar una gráfica de residuos frente al tiempo casi normal, pero quiero estar seguro. ¿Cómo puedo comprobar la normalidad de los residuos de
Breiman dice que los árboles se cultivan sin podar. ¿Por qué? Quiero decir que debe haber una razón sólida por la cual los árboles en un bosque aleatorio no se poden. Por otro lado, se considera muy importante podar un solo árbol de decisión para evitar un ajuste excesivo. ¿Hay alguna literatura...
Estoy usando libsvm en modo C-SVC con un núcleo polinomial de grado 2 y estoy obligado a entrenar múltiples SVM. Cada conjunto de entrenamiento tiene 10 características y 5000 vectores. Durante el entrenamiento, recibo esta advertencia para la mayoría de los SVM que entreno: WARNING: reaching max...
Supongamos que tengo 20 ratones. Emparejo los ratones de alguna manera, de modo que obtengo 10 pares. Para el propósito de esta pregunta, podría ser un emparejamiento aleatorio, O podría ser un emparejamiento sensato, como tratar de emparejar ratones de la misma camada, del mismo sexo, con un peso...
Los datos para ciertos tipos de variables tienden a ser no normales cuando se miden en poblaciones particulares (por ejemplo, niveles de depresión en una población de personas con trastorno depresivo mayor). Dado que Pearson asume la normalidad, ¿cuán robusto es el estadístico de prueba en...
Una compañera de trabajo está analizando algunos datos biológicos para su disertación con cierta heterocedasticidad desagradable (figura a continuación). Lo está analizando con un modelo mixto pero todavía tiene problemas con los residuos. La transformación logarítmica de las variables de...
No quiero saber si algunos fenómenos en la naturaleza tienen una distribución normal, sino si podemos ver en alguna parte la forma de la curva normal como podemos verla, por ejemplo, en el cuadro de Galton. Ver esta figura de Wikipedia. Tenga en cuenta que muchas formas o curvas matemáticas se...
¿Cuál es el significado de la tilde al especificar distribuciones de probabilidad? Por ejemplo: Z∼Normal(0,1).Z∼Normal(0,1).Z \sim
Estoy trabajando en un algoritmo que se basa en el hecho de que las observaciones s se distribuyen normalmente, y me gustaría probar empíricamente la robustez del algoritmo a este supuesto.YYY Para hacer esto, yo estaba buscando una secuencia de transformaciones que pueda interrumpir...
Suponga que son variables aleatorias continuas con segundos momentos finitos. La versión de población del coeficiente de correlación de rango de Spearman se puede definir como el coeficiente de momento del producto de Pearson ρ de las integrales de probabilidad transforma y F_Y (Y) , donde F_X, F_Y...
¿Por qué no funciona la propagación hacia atrás cuando inicializa todo el peso con el mismo valor (digamos 0.5), pero funciona bien cuando se le dan números aleatorios? ¿No debería el algoritmo calcular el error y trabajar desde allí, a pesar de que los pesos son inicialmente los...
La "supervisión distante" es un esquema de aprendizaje en el que se aprende un clasificador dado un conjunto de entrenamiento débilmente etiquetado (los datos de entrenamiento se etiquetan automáticamente según la heurística / reglas). Creo que tanto el aprendizaje supervisado como el aprendizaje...
¿Hay alguna forma de probar la separabilidad lineal de un conjunto de datos de dos clases en altas dimensiones? Mis vectores de características son de 40 de largo. Sé que siempre puedo ejecutar experimentos de regresión logística y determinar la tasa de aciertos frente a la tasa de falsas alarmas...
Estoy usando R y he estado analizando mis datos con GLM con el enlace Binomial. Quiero saber cuál es el significado de la intercepción en la tabla de salida. La intercepción de uno de mis modelos es significativamente diferente, sin embargo, la variable no lo es. ¿Qué significa esto? ¿Qué es la...
Wikipedia y la viñeta del paquete sándwich R brindan buena información sobre los supuestos que respaldan los errores estándar del coeficiente MCO y los antecedentes matemáticos de los estimadores sándwich. Sin embargo, todavía no estoy claro cómo se aborda el problema de la heteroscedasticidad...
¿Alguien puede probar la siguiente conexión entre la métrica de información de Fisher y la entropía relativa (o divergencia KL) de una manera puramente matemática rigurosa? D(p(⋅,a+da)∥p(⋅,a))=12gi,jdaidaj+(O(∥da∥3)D(p(⋅,a+da)∥p(⋅,a))=12gi,jdaidaj+(O(‖da‖3)D( p(\cdot , a+da) \parallel p(\cdot,a) )...
Comienzo con mi regresión OLS: donde D es una variable ficticia, las estimaciones se vuelven diferentes de cero con un valor p bajo. Luego realizo una prueba Ramsey RESET y descubro que tengo alguna especificación incorrecta de la ecuación, por lo tanto, incluyo x al cuadrado: y = β 0 + β 1 x 1...
Quiero implementar el algoritmo EM manualmente y luego compararlo con los resultados normalmixEMdel mixtoolspaquete. Por supuesto, sería feliz si ambos conducen a los mismos resultados. La referencia principal es Geoffrey McLachlan (2000), Modelos de mezclas finitas . Tengo una densidad de mezcla...
Recientemente me encontré con la palabra "Aprendizaje de refuerzo recurrente". Entiendo qué es "Red neuronal recurrente" y qué es "Aprendizaje de refuerzo", pero no pude encontrar mucha información sobre lo que es un "Aprendizaje de refuerzo recurrente". ¿Puede alguien explicarme qué es un...
Tengo una variable aleatoria donde a es normal distribuido . ¿Qué puedo decir sobre y ? Una aproximación también sería útil.X(a)=log(a)X(a)=log(a)X(a) = \log(a)N(μ,σ2)N(μ,σ2)\mathcal