Estadísticas y Big Data

15

Comparación entre Newey-West (1987) y Hansen-Hodrick (1980)

Pregunta: ¿Cuáles son las principales diferencias y similitudes entre el uso de los errores estándar de Newey-West (1987) y Hansen-Hodrick (1980)? ¿En qué situaciones se debe preferir uno de estos sobre el otro? Notas: Sí sé cómo funciona cada uno de estos procedimientos de ajuste; sin embargo,...

15

¿Cuál es la "capacidad" de un modelo de aprendizaje automático?

Estoy estudiando este Tutorial sobre Autoencoders Variacionales de Carl Doersch . En la segunda página dice: Uno de los marcos más populares es el Autoencoder Variacional [1, 3], el tema de este tutorial. Los supuestos de este modelo son débiles, y el entrenamiento es rápido a través de la...

machine-learning deep-learning autoencoders variational-bayes

15

Usando glm () como sustituto de la prueba simple de chi cuadrado

Estoy interesado en cambiar las hipótesis nulas usando glm()en R. Por ejemplo: x = rbinom(100, 1, .7) summary(glm(x ~ 1, family = "binomial")) prueba la hipótesis de que . ¿Qué pasa si quiero cambiar el valor nulo a = algún valor arbitrario, dentro ? p=0.5p=0.5p = 0.5pppglm() Sé que esto...

r hypothesis-testing generalized-linear-model chi-squared offset

15

¿Qué es la Clasificación temporal conexionista (CTC)?

Estoy buscando hacer un proyecto de reconocimiento óptico de caracteres (OCR). Después de investigar un poco, me he encontrado con una arquitectura que parece interesante: CNN + RNN + CTC. Estoy familiarizado con las redes neuronales contorneadas (CNN) y las redes neuronales recurrentes (RNN), pero...

machine-learning deep-learning conv-neural-network rnn

15

logloss vs gini / auc

He entrenado dos modelos (clasificadores binarios usando h2o AutoML) y quiero seleccionar uno para usar. Tengo los siguientes resultados: model_id auc logloss logloss_train logloss_valid gini_train gini_valid DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975 DL_grid_2 0.543685...

model-selection validation auc gini log-loss

15

Intuición sobre la estimación de parámetros en modelos mixtos (parámetros de varianza vs. modos condicionales)

He leído muchas veces que los efectos aleatorios (BLUP / modos condicionales para, por ejemplo, sujetos) no son parámetros de un modelo de efectos lineales mixtos, sino que pueden derivarse de los parámetros estimados de varianza / covarianza. Por ejemplo, Reinhold Kliegl et al. (2011) estado:...

mixed-model intuition blup

15

¿Cuándo es inapropiado controlar una variable?

Puedo pensar en al menos un ejemplo ingenuo. Supongamos que quiero estudiar la relación entre X y Z. También sospecho que Y influye en Z, así que controlo para Y. Sin embargo, resulta que, sin que yo lo sepa, X causa Y e Y causa Z. Por lo tanto, controlando para Y, "encubro" la relación entre X y...

mediation controlling-for-a-variable

15

¿Cuáles son algunos usos importantes de la generación de números aleatorios en las estadísticas computacionales?

¿Cómo y por qué son importantes los generadores de números aleatorios (RNG) en las estadísticas computacionales? Entiendo que la aleatoriedad es importante al elegir muestras para muchas pruebas estadísticas para evitar sesgos hacia cualquiera de las hipótesis, pero ¿hay otras áreas de estadística...

hypothesis-testing monte-carlo algorithms random-generation computational-statistics

15

¿Cuál es la derivada de la función de activación ReLU?

¿Cuál es la derivada de la función de activación ReLU definida como: ReLU(x)=max(0,x)ReLU(x)=max(0,x) \mathrm{ReLU}(x) = \mathrm{max}(0, x) ¿Qué pasa con el caso especial donde hay una discontinuidad en la función en

self-study neural-networks

15

¿Se puede escribir una ecuación variable de instrumento como un gráfico acíclico dirigido (DAG)?

Los gráficos acíclicos dirigidos (DAG) son representaciones visuales eficientes de supuestos causales cualitativos en modelos estadísticos, pero ¿pueden usarse para presentar una ecuación variable de instrumento regular (u otras ecuaciones)? ¿Si es así, cómo? Si no, ¿por

causality instrumental-variables dag

15

¿Por qué

probability bayesian

15

¿Es la suma de dos árboles de decisión equivalentes a un solo árbol de decisión?

Supongamos que tenemos dos árboles de regresión (árbol A y árbol B) que asignan la entrada a la salida . Sea para el árbol A y para el árbol B. Cada árbol usa divisiones binarias, con hiperplanos como funciones de separación.x ∈ RreX∈Rrex \in \mathbb{R}^dy^∈ Ry^∈R\hat{y} \in \mathbb{R}y^= fUN( x...

regression machine-learning cart

15

Aceptación de hipótesis nula

Esta es una pregunta de discusión sobre la intersección de las estadísticas y otras ciencias. A menudo me enfrento al mismo problema: los investigadores en mi campo tienden a decir que no hay ningún efecto cuando el valor p no es inferior al nivel de significancia. Al principio, a menudo respondía...

hypothesis-testing

15

Minimizando el sesgo en el modelado explicativo, ¿por qué? ("Explicar o predecir" de Galit Shmueli)

Esta pregunta hace referencia al artículo de Galit Shmueli "Explicar o predecir" . Específicamente, en la sección 1.5, "Explicación y predicción son diferentes", el profesor Shmueli escribe: En el modelado explicativo, el objetivo es minimizar el sesgo para obtener la representación más precisa...

predictive-models inference bias unbiased-estimator explanatory-models

15

Redes neuronales vs todo lo demás

No he encontrado una respuesta satisfactoria a esto de google . Por supuesto, si los datos que tengo son del orden de millones, entonces el aprendizaje profundo es el camino. Y he leído que cuando no tengo grandes datos, tal vez sea mejor usar otros métodos en el aprendizaje automático. La razón...

regression machine-learning classification neural-networks deep-learning

15

La prueba de fórmulas equivalentes de regresión de crestas

He leído los libros más populares sobre aprendizaje estadístico. 1- Los elementos del aprendizaje estadístico. 2- Una introducción al aprendizaje estadístico . Ambos mencionan que la regresión de crestas tiene dos fórmulas que son equivalentes. ¿Existe una prueba matemática comprensible de este...

regression lasso regularization ridge-regression lagrange-multipliers

15

¿Es el segundo parámetro para la distribución normal la varianza o la desviación estándar?

A veces he visto libros de texto que se refieren al segundo parámetro en la distribución normal como la desviación estándar y la varianza. Por ejemplo, la variable aleatoria X ~ N (0, 4). No está claro si sigma o sigma al cuadrado es igual a 4. Solo quiero averiguar la convención general que se usa...

distributions normal-distribution

15

Calcular intervalos de confianza para una regresión logística

Estoy usando una regresión logística binomial para identificar si la exposición has_xo has_yimpacto tiene la probabilidad de que un usuario haga clic en algo. Mi modelo es el siguiente: fit = glm(formula = has_clicked ~ has_x + has_y, data=df, family = binomial()) Este es el resultado de mi...

regression logistic standard-error logit

15

¿Qué distribución usar para modelar el tiempo antes de que llegue un tren?

Estoy tratando de modelar algunos datos sobre los horarios de llegada del tren. Me gustaría usar una distribución que capture "cuanto más espere, más probabilidades habrá de que el tren aparezca" . Parece que tal distribución debería verse como un CDF, de modo que P (aparición del tren | esperado...

distributions modeling

15

¿Cuál es la necesidad de supuestos en la regresión lineal?

En regresión lineal, hacemos los siguientes supuestos La media de la respuesta, E(Yi)E(Yi)E(Y_i) , en cada conjunto de valores de los predictores, (x1i,x2i,…)(x1i,x2i,…)(x_{1i}, x_{2i},…) , es una función lineal de los predictores. Los errores, , son independientes.εiεiε_i Los errores, εiεiε_i ,...

regression assumptions