Estadísticas y Big Data

8

¿Qué es el sesgo de una distribución? Le pregunto por qué algunos índices particulares parecen indecisos sobre la simetría y, en algunos casos, también sobre la asimetría.

8

Definición de validez de una variable instrumental.

¿Qué significa exactamente "validez de un instrumento"? En mi curso de econometría acabamos de definir la validez del instrumento comoE[Z|u]=0E[Z|u]=0E[Z|u]=0, dónde ZZZ es la variable instrumental y uuues el término de error de un modelo de regresión univariante. Luego, también hablamos sobre la...

econometrics instrumental-variables

8

Cómo realizar SVD para imputar valores perdidos, un ejemplo concreto

He leído los excelentes comentarios sobre cómo lidiar con los valores perdidos antes de aplicar SVD, pero me gustaría saber cómo funciona con un ejemplo simple: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada la matriz anterior, si elimino los valores de NA,...

r missing-data data-imputation svd sampling matlab mcmc importance-sampling predictive-models prediction algorithms graphical-model graph-theory r regression regression-coefficients r-squared r regression modeling confounding residuals fitting glmm zero-inflation overdispersion optimization curve-fitting regression time-series order-statistics bayesian prior uninformative-prior probability discrete-data kolmogorov-smirnov r data-visualization histogram dimensionality-reduction classification clustering accuracy semi-supervised labeling state-space-models t-test biostatistics paired-comparisons paired-data bioinformatics regression logistic multiple-regression mixed-model random-effects-model neural-networks error-propagation numerical-integration time-series missing-data data-imputation probability self-study combinatorics survival cox-model statistical-significance wilcoxon-mann-whitney hypothesis-testing distributions normal-distribution variance t-distribution probability simulation random-walk diffusion hypothesis-testing z-test hypothesis-testing data-transformation lognormal r regression agreement-statistics classification svm mixed-model non-independent observational-study goodness-of-fit residuals confirmatory-factor neural-networks deep-learning

8

¿Cuál es el punto de dividir los datos en partes de capacitación y prueba para evaluar las propiedades de predicción cuando tenemos AIC?

Asintóticamente, minimizar el AIC es equivalente a minimizar el MSE de validación cruzada de dejar uno fuera para los datos de sección transversal [ 1 ]. Entonces, cuando tenemos AIC, ¿por qué uno usa el método de dividir los datos en conjuntos de capacitación, validación y prueba para medir las...

predictive-models aic

8

¿Por qué usar probabilidades y no probabilidades en regresión logística?

¿Por qué usaríamos probabilidades en lugar de probabilidades al realizar una regresión

regression logistic odds

8

¿Por qué los errores estándar están sesgados hacia abajo cuando se consideran instrumentos débiles?

Me preguntaba por qué los errores estándar son (severamente) sesgados hacia abajo cuando se usa la variable instrumental (general) - estimador o el método generalizado de estimador de momentos

estimation instrumental-variables generalized-moments

8

Desestacionalizar datos con análisis de Fourier

Tengo una información que tiene dos comportamientos subyacentes. Primero hay una periodicidad en ello. Parece una curva sinusoidal. En segundo lugar, los puntos de datos tienen un crecimiento constante. Entonces, si tengo 100 puntos de datos sin ningún crecimiento, se verá como una curva...

time-series seasonality trend fourier-transform

8

Rastreo de probabilidad extraño de la cadena MCMC

Tengo un modelo que va: Single parameter -> Complex likelihood function -> Log-likelihood. Ejecuté una cadena MCMC (usando pymc) y tracé el rastro del parámetro y la probabilidad logarítmica. La estimación del parámetro terminó siendo razonable, pero el gráfico de probabilidad de registro me...

mcmc likelihood

8

¿Cómo probar esta desigualdad de la mezcla gaussiana? (Ajuste / sobreajuste)

Sea f [x] una mezcla de Gauss pdf con n términos de peso uniforme, significa {μ1, . . . ,μnorte}{μ1,...,μn}\{\mu_{1},...,\mu_{n}\}, y las variaciones correspondientes {σ1, . . . ,σnorte}{σ1,...,σn}\{\sigma_{1},...,\sigma_{n}\} : F( x ) ≡1norte∑i = 1norte12 πσ2yo----√mi-( x...

machine-learning gaussian-mixture

8

R al cuadrado y regresión polinómica de orden superior

La siguiente gráfica muestra la saturación de una carretera contra el impacto en el tiempo de viaje (normalizado a tiempo de viaje de flujo libre). La curva azul (función BPR) presenta un modelo estandarizado utilizado en el campo para relacionar el tiempo de viaje y la saturación. Para los...

regression chi-squared r-squared

8

RNN aprendiendo ondas sinusoidales de diferentes frecuencias

Como calentamiento con redes neuronales recurrentes, estoy tratando de predecir una onda sinusoidal a partir de otra onda sinusoidal de otra frecuencia. Mi modelo es un RNN simple, su pase directo se puede expresar de la siguiente manera: rtzt= σ(Wyo n⋅Xt+Wr e c⋅rt - 1) )=Wo u...

regression time-series neural-networks deep-learning rnn

8

Entendiendo que intuitivamente

Acabo de ver esta pregunta y la maravillosa respuesta aceptada en este foro. Luego me activaron para tratar de comprender intuitivamente por qué la división de está normalizando la covarianza:SxSySxSyS_xS_y COV(X,Y)SxSy∈[−1,1]COV⁡(X,Y)SxSy∈[−1,1]\frac{\operatorname{COV}(X,Y)}{S_xS_y} \in...

correlation variance covariance intuition

8

¿Cómo reformulo estadísticamente esta pregunta?

Estoy analizando un conjunto de datos que contiene observaciones de n número de intentos de jugadores en un juego. Si estoy construyendo un modelo de regresión para predecir el resultado de cada intento dado 1 o más descriptores con respecto al intento de cada jugador , ¿cómo mido cuántos intentos...

regression statistical-significance bayesian p-value sequence-analysis

8

Uso de errores estándar de HAC aunque puede que no haya autocorrelación

Estoy ejecutando un par de regresiones y, como quería estar en el lado seguro, decidí usar errores estándar HAC (heteroscedasticidad y autocorrelación consistentes) en todo momento. Puede haber algunos casos en los que la correlación en serie no está presente. ¿Es de todos modos un enfoque válido?...

time-series least-squares standard-error robust robust-standard-error

8

Cómo expresar celdas de una tabla 2x2 en términos de coeficiente phi y probabilidades marginales

Considere una tabla típica de frecuencias de 2x2 (que se muestra en esta imagen): Notación: La variable de fila se denota R y toma los valores 0 o 1; la variable de columna se denota C y toma valores 0 o 1. Las celdas de la tabla indican la frecuencia de cada combinación de R y C; por ejemplo, es...

contingency-tables simultaneous-equation

8

¿Una red neuronal de diseño óptimo contiene cero neuronas ReLU "muertas" cuando se entrena?

En general, ¿debería volver a entrenar mi red neuronal con menos neuronas para que tenga menos neuronas ReLU muertas? He leído opiniones contradictorias sobre ReLU muertos. Algunas fuentes dicen que los ReLU muertos son buenos porque fomentan la escasez. Otros dicen que son malos porque los ReLU...

machine-learning neural-networks conv-neural-network

8

ajuste GLM para la familia weibull [cerrado]

Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado el año pasado . Estoy tratando de ajustar el modelo lineal...

r generalized-linear-model survival gamlss

8

Modo de normalización de aprendizaje de Scikit (L1 vs L2 y Max)

Me preguntaba si alguien aquí puede explicar la diferencia entre el modo de normalización l1, l2 y max en el módulo sklearn.preprocessing.normalize ()? ¡Después de leer la documentación no pude notar la

normalization scikit-learn

8

Ley de la expedición total / regla de la torre: ¿Por qué ambas variables aleatorias deben provenir del mismo espacio de probabilidad?

Cito (el énfasis es mío) de la definición de Wikipedia : La proposición en la teoría de probabilidad conocida como la ley de la expectativa total, ..., establece que si X es una variable aleatoria integrable (es decir, una variable aleatoria que satisface E (| X |) <∞) e Y es cualquier...

probability expected-value conditional-expectation

8

¿Hay alguna forma de lidiar con el gradiente de desaparición para saturar las no linealidades que no involucran unidades de Normalización por lotes o ReLu?

Quería entrenar una red con no linealidades que sufren el desvanecimiento (o el problema de gradiente explosivo, aunque principalmente se desvanecen). Sé que la forma estándar (actual) es usar la normalización por lotes 1 [BN] 1 o simplemente abandonar la no linealidad y usar las unidades ReLu...

machine-learning neural-networks conv-neural-network batch-normalization