Estadísticas y Big Data

18

¿Realmente realizamos análisis de regresión multivariante con * millones * de coeficientes / variables independientes?

Estoy pasando algo de tiempo aprendiendo machine learning (perdón por la recursividad :) y no pude evitar sentirme intrigada por la regla general de elegir Gradient Descent sobre la resolución de ecuaciones directas para calcular los coeficientes de regresión, en el caso de la regresión lineal...

machine-learning multiple-regression large-data

18

Cómo hacer que una recompensa funcione en el aprendizaje por refuerzo

Mientras estudiaba el aprendizaje por refuerzo, me encontré con muchas formas de la función de recompensa: , R ( s , a , s ' ) e incluso una función de recompensa que solo depende del estado actual. Dicho esto, me di cuenta de que no es muy fácil 'hacer' o 'definir' una función de recompensa.R ( s...

machine-learning reinforcement-learning

18

¿Ventajas de la optimización de enjambre de partículas sobre la optimización bayesiana para el ajuste de hiperparámetros?

Existe una importante investigación contemporánea sobre la optimización bayesiana (1) para ajustar los hiperparámetros ML. La motivación principal aquí es que se requiere un número mínimo de puntos de datos para tomar decisiones informadas sobre qué puntos vale la pena intentar (las llamadas a...

hyperparameter bayesian-optimization optunity

18

Cómo manejar la variable categórica ordinal como variable independiente

Estoy usando un modelo logit. Mi variable dependiente es binaria. Sin embargo, tengo una variable independiente que es categórica y contiene las respuestas: 1.very good, 2.good, 3.average, 4.poor and 5.very poor. Entonces, es ordinal ("categórico cuantitativo"). No estoy seguro de cómo manejar esto...

regression logistic ordinal-data predictor

18

En estadística, ¿debo suponer que

Estoy estudiando estadísticas y, a menudo, encuentro fórmulas que contienen el logy siempre estoy confundido si debo interpretarlo como el significado estándar de log, es decir, base 10, o si en estadística log generalmente se supone que el símbolo es el registro natural ln. En particular, estoy...

mathematical-statistics notation logarithm

18

¿Por qué los mínimos cuadrados ordinarios funcionan mejor que la regresión de Poisson?

Estoy tratando de ajustar una regresión para explicar el número de homicidios en cada distrito de una ciudad. Aunque sé que mis datos siguen una distribución de Poisson, intenté ajustar un OLS como este: log(y+1)=α+βX+ϵlog(y+1)=α+βX+ϵlog(y+1) = \alpha + \beta X + \epsilon Luego, también probé...

regression least-squares poisson-regression

18

Si el núcleo Epanechnikov es teóricamente óptimo cuando se hace la Estimación de la densidad del núcleo, ¿por qué no se usa más comúnmente?

He leído (por ejemplo, aquí ) que el núcleo Epanechnikov es óptimo, al menos en un sentido teórico, al hacer la estimación de la densidad del núcleo. Si esto es cierto, ¿por qué el gaussiano aparece con tanta frecuencia como el núcleo predeterminado, o en muchos casos el único núcleo, en las...

nonparametric kernel-smoothing

18

¿Es la varianza un concepto más fundamental que la desviación estándar?

En este sitio web de psicometría leí que [A] ta la variación de nivel profundo es un concepto más fundamental que la desviación estándar. El sitio en realidad no explica más por qué la variación debe ser más fundamental que la desviación estándar, pero me recordó que he leído algunas cosas...

variance standard-deviation

18

Complejidad computacional k-NN

¿Cuál es la complejidad temporal del algoritmo k -NN con un enfoque de búsqueda ingenuo (sin árbol kd o similares)? Estoy interesado en su complejidad temporal considerando también el hiperparámetro k . He encontrado respuestas contradictorias: O (nd + kn), donde n es la cardinalidad del...

k-nearest-neighbour time-complexity

18

¿Qué hace que las redes neuronales sean un modelo de clasificación no lineal?

Estoy tratando de entender el significado matemático de los modelos de clasificación no lineal: Acabo de leer un artículo que habla de que las redes neuronales son un modelo de clasificación no lineal. Pero me doy cuenta de que: La primera

neural-networks nonlinear-regression nonlinear

18

Opiniones sobre Oversampling en general, y el algoritmo SMOTE en particular [cerrado]

Cerrada . Esta pregunta está basada en la opinión . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que pueda ser respondida con hechos y citas editando esta publicación . Cerrado hace 2 años . ¿Cuál es...

machine-learning classification oversampling

18

¿Deben tomarse muestras de entrenamiento extraídas al azar para redes neuronales de entrenamiento de mini lotes sin reemplazo?

Definimos una época como haber pasado por la totalidad de todas las muestras de entrenamiento disponibles, y el tamaño del mini lote como el número de muestras sobre el que promediamos para encontrar las actualizaciones de pesos / sesgos necesarios para descender el gradiente. Mi pregunta es si...

machine-learning neural-networks optimization deep-learning

18

¿Cómo realizar una prueba post-hoc en el modelo lmer?

Este es mi marco de datos: Group <- c("G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G1","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G2","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3","G3") Subject <-...

r lme4-nlme post-hoc

18

¿Por qué los estadísticos definieron matrices aleatorias?

Estudié matemáticas hace una década, así que tengo antecedentes en matemáticas y estadísticas, pero esta pregunta me está matando. Esta pregunta sigue siendo un poco filosófica para mí. ¿Por qué los estadísticos desarrollaron todo tipo de técnicas para trabajar con matrices aleatorias? Quiero...

distributions mathematical-statistics random-variable random-matrix

18

¿Las estadísticas bayesianas hacen que el metanálisis sea obsoleto?

Me pregunto si las estadísticas bayesianas se aplicarían en consecuencia desde el primer estudio hasta el último si esto hace que un metanálisis sea obsoleto. Por ejemplo, supongamos 20 estudios que se han realizado en diferentes puntos de tiempo. La estimación o distribución del primer estudio...

bayesian meta-analysis

18

¿Qué significa hacer que el tamaño de la muestra sea una variable aleatoria?

Frank Harrell ha comenzado un blog ( Pensamiento estadístico) . En su publicación principal , enumera algunas características clave de su filosofía estadística. Entre otros artículos, incluye: Convertir el tamaño de la muestra en una variable aleatoria cuando sea posible ¿Qué significa...

sample-size random-variable regression-strategies

18

¿Existe una suposición sobre regresión logística?

¿Existe alguna suposición sobre la variable de respuesta de regresión logística? Por ejemplo, supongamos que tenemos puntos de datos. Parece que la respuesta proviene de una distribución de Bernoulli con . Por lo tanto, deberíamos tener distribuciones de Bernoulli, con diferentes parámetros .Y i p...

regression logistic assumptions iid

18

¿El teorema de Bayes es válido para las expectativas?

¿Es cierto que para dos variables aleatorias y ,AAABBB E(A∣B)=E(B∣A)E(A)E(B)?E(A∣B)=E(B∣A)E(A)E(B)?E(A\mid B)=E(B\mid

bayesian mathematical-statistics

18

¿Por qué hay -1 en la función de densidad de distribución beta?

La distribución beta aparece bajo dos parametrizaciones (o aquí ) f(x)∝xα(1−x)β(1)(1)f(x)∝xα(1−x)β f(x) \propto x^{\alpha} (1-x)^{\beta} \tag{1} o el que parece ser usado más comúnmente f(x)∝xα−1(1−x)β−1(2)(2)f(x)∝xα−1(1−x)β−1 f(x) \propto x^{\alpha-1} (1-x)^{\beta-1} \tag{2} Pero, ¿por qué...

distributions references beta-distribution history beta-binomial

18

¿Por qué la prueba t y ANOVA dan valores p diferentes para la comparación de dos grupos?

En el artículo de Wikipedia sobre ANOVA , dice En su forma más simple, ANOVA proporciona una prueba estadística de si las medias de varios grupos son iguales y, por lo tanto, generaliza la prueba t a más de dos grupos. Según tengo entendido, ANOVA es lo mismo que la prueba t cuando se trata de...

r hypothesis-testing anova t-test