¿Qué es el sesgo de una distribución? Le pregunto por qué algunos índices particulares parecen indecisos sobre la simetría y, en algunos casos, también sobre la asimetría.
¿Qué es el sesgo de una distribución? Le pregunto por qué algunos índices particulares parecen indecisos sobre la simetría y, en algunos casos, también sobre la asimetría.
¿Qué significa exactamente "validez de un instrumento"? En mi curso de econometría acabamos de definir la validez del instrumento comoE[Z|u]=0E[Z|u]=0E[Z|u]=0, dónde ZZZ es la variable instrumental y uuues el término de error de un modelo de regresión univariante. Luego, también hablamos sobre la...
He leído los excelentes comentarios sobre cómo lidiar con los valores perdidos antes de aplicar SVD, pero me gustaría saber cómo funciona con un ejemplo simple: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada la matriz anterior, si elimino los valores de NA,...
Asintóticamente, minimizar el AIC es equivalente a minimizar el MSE de validación cruzada de dejar uno fuera para los datos de sección transversal [ 1 ]. Entonces, cuando tenemos AIC, ¿por qué uno usa el método de dividir los datos en conjuntos de capacitación, validación y prueba para medir las...
¿Por qué usaríamos probabilidades en lugar de probabilidades al realizar una regresión
Me preguntaba por qué los errores estándar son (severamente) sesgados hacia abajo cuando se usa la variable instrumental (general) - estimador o el método generalizado de estimador de momentos
Tengo una información que tiene dos comportamientos subyacentes. Primero hay una periodicidad en ello. Parece una curva sinusoidal. En segundo lugar, los puntos de datos tienen un crecimiento constante. Entonces, si tengo 100 puntos de datos sin ningún crecimiento, se verá como una curva...
Tengo un modelo que va: Single parameter -> Complex likelihood function -> Log-likelihood. Ejecuté una cadena MCMC (usando pymc) y tracé el rastro del parámetro y la probabilidad logarítmica. La estimación del parámetro terminó siendo razonable, pero el gráfico de probabilidad de registro me...
Sea f [x] una mezcla de Gauss pdf con n términos de peso uniforme, significa {μ1, . . . ,μnorte}{μ1,...,μn}\{\mu_{1},...,\mu_{n}\}, y las variaciones correspondientes {σ1, . . . ,σnorte}{σ1,...,σn}\{\sigma_{1},...,\sigma_{n}\} : F( x ) ≡1norte∑i = 1norte12 πσ2yo----√mi-( x...
La siguiente gráfica muestra la saturación de una carretera contra el impacto en el tiempo de viaje (normalizado a tiempo de viaje de flujo libre). La curva azul (función BPR) presenta un modelo estandarizado utilizado en el campo para relacionar el tiempo de viaje y la saturación. Para los...
Como calentamiento con redes neuronales recurrentes, estoy tratando de predecir una onda sinusoidal a partir de otra onda sinusoidal de otra frecuencia. Mi modelo es un RNN simple, su pase directo se puede expresar de la siguiente manera: rtzt= σ(Wyo n⋅Xt+Wr e c⋅rt - 1) )=Wo u...
Acabo de ver esta pregunta y la maravillosa respuesta aceptada en este foro. Luego me activaron para tratar de comprender intuitivamente por qué la división de está normalizando la covarianza:SxSySxSyS_xS_y COV(X,Y)SxSy∈[−1,1]COV(X,Y)SxSy∈[−1,1]\frac{\operatorname{COV}(X,Y)}{S_xS_y} \in...
Estoy analizando un conjunto de datos que contiene observaciones de n número de intentos de jugadores en un juego. Si estoy construyendo un modelo de regresión para predecir el resultado de cada intento dado 1 o más descriptores con respecto al intento de cada jugador , ¿cómo mido cuántos intentos...
Estoy ejecutando un par de regresiones y, como quería estar en el lado seguro, decidí usar errores estándar HAC (heteroscedasticidad y autocorrelación consistentes) en todo momento. Puede haber algunos casos en los que la correlación en serie no está presente. ¿Es de todos modos un enfoque válido?...
Considere una tabla típica de frecuencias de 2x2 (que se muestra en esta imagen): Notación: La variable de fila se denota R y toma los valores 0 o 1; la variable de columna se denota C y toma valores 0 o 1. Las celdas de la tabla indican la frecuencia de cada combinación de R y C; por ejemplo, es...
En general, ¿debería volver a entrenar mi red neuronal con menos neuronas para que tenga menos neuronas ReLU muertas? He leído opiniones contradictorias sobre ReLU muertos. Algunas fuentes dicen que los ReLU muertos son buenos porque fomentan la escasez. Otros dicen que son malos porque los ReLU...
Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado el año pasado . Estoy tratando de ajustar el modelo lineal...
Me preguntaba si alguien aquí puede explicar la diferencia entre el modo de normalización l1, l2 y max en el módulo sklearn.preprocessing.normalize ()? ¡Después de leer la documentación no pude notar la
Cito (el énfasis es mío) de la definición de Wikipedia : La proposición en la teoría de probabilidad conocida como la ley de la expectativa total, ..., establece que si X es una variable aleatoria integrable (es decir, una variable aleatoria que satisface E (| X |) <∞) e Y es cualquier...
Quería entrenar una red con no linealidades que sufren el desvanecimiento (o el problema de gradiente explosivo, aunque principalmente se desvanecen). Sé que la forma estándar (actual) es usar la normalización por lotes 1 [BN] 1 o simplemente abandonar la no linealidad y usar las unidades ReLu...