Estadísticas y Big Data

40

¿Cómo resuelve la función de activación rectilínea el problema del gradiente de fuga en las redes neuronales?

Encontré la unidad lineal rectificada (ReLU) elogiada en varios lugares como una solución al problema del gradiente de fuga para las redes neuronales. Es decir, uno usa max (0, x) como función de activación. Cuando la activación es positiva, es obvio que es mejor que, digamos, la función de...

40

¿La independencia estadística significa falta de causalidad?

Dos variables aleatorias A y B son estadísticamente independientes. Eso significa que en el DAG del proceso: y, por supuesto, . ¿Pero eso también significa que no hay puerta de entrada de B a A?P ( A | B ) = P ( A )( A ⊥⊥ B)(A⊥⊥B)(A {\perp\!\!\!\perp} B)PAGS( A | B ) = P( A...

independence causality bayesian-network dag

39

Clojure versus R: ventajas y desventajas para el análisis de datos

Tenía un plan para aprender R en el futuro cercano. Leyendo otra pregunta descubrí sobre Clojure. Ahora no sé qué hacer. Creo que una gran ventaja de R para mí es que algunas personas en Economía lo usan, incluido uno de mis supervisores (aunque el otro dijo: ¡manténgase alejado de R!). Una...

r

39

Valores negativos para AICc (Criterio de información de Akaike corregido)

He calculado AIC y AICc para comparar dos modelos lineales mixtos generales; Los AIC son positivos con el modelo 1 que tiene un AIC más bajo que el modelo 2. Sin embargo, los valores para AICc son negativos (el modelo 1 sigue siendo <modelo 2). ¿Es válido usar y comparar valores negativos de...

mixed-model model-selection aic

39

¿Cómo probar la hipótesis de que no hay diferencias grupales?

Imagine que tiene un estudio con dos grupos (p. Ej., Hombres y mujeres) que analiza una variable dependiente numérica (p. Ej., Puntajes de las pruebas de inteligencia) y tiene la hipótesis de que no hay diferencias grupales. Pregunta: ¿Cuál es una buena manera de probar si no hay diferencias...

hypothesis-testing t-test equivalence tost

39

Modo, clase y tipo de objetos R

Me preguntaba ¿cuáles son las diferencias entre los modos, clase y tipo de objetos R? El tipo de un objeto R se puede obtener mediante la función typeof (), modo por modo () y clase por clase (). ¿También otras funciones y conceptos similares que me perdí? ¡Gracias y

r

39

Rango en R - orden descendente [cerrado]

Estoy buscando clasificar datos que, en algunos casos, el valor más grande tiene el rango de 1. Soy relativamente nuevo en R, pero no veo cómo puedo ajustar esta configuración en la función de rango. x <- c(23,45,12,67,34,89) rank(x) genera: [1] 2 4 1 5 3 6 cuando quiero que sea: [1] 5 3 6...

r

39

Función de resumen de datos gráficos (resumen) en R

Estoy seguro de que he encontrado una función como esta en un paquete R antes, pero después de buscar en Google, parece que no puedo encontrarla en ningún lado. La función en la que estoy pensando produjo un resumen gráfico para una variable dada, produciendo resultados con algunos gráficos (un...

r data-visualization descriptive-statistics eda

39

Regresión de ángulo mínimo vs. lazo

La regresión de ángulo mínimo y el lazo tienden a producir rutas de regularización muy similares (idénticas excepto cuando un coeficiente cruza cero). Ambos pueden ajustarse eficientemente mediante algoritmos prácticamente idénticos. ¿Hay alguna razón práctica para preferir un método sobre el...

regression lasso

39

¿Cuál es el significado del "." (Punto) en R?

Solo estoy leyendo el libro "R in a Nutshell". Y parece como si me saltara la parte donde el "." como en "sample.formula" se explicó. > sample.formula <- as.formula(y~x1+x2) ¿Es la muestra un objeto con una fórmula de campo como en otros idiomas? Y si es así, ¿cómo puedo averiguar qué otros...

r

39

¿Cómo interpretar e informar eta cuadrado / eta cuadrado parcial en análisis estadísticamente significativos y no significativos?

Tengo datos que tienen valores de eta al cuadrado y valores de eta al cuadrado parcial calculados como una medida del tamaño del efecto para las diferencias de medias de grupo. ¿Cuál es la diferencia entre eta cuadrado y parcial eta cuadrado? ¿Pueden ambos ser interpretados usando las mismas...

anova statistical-significance effect-size

39

¿Cuál es la varianza de la mezcla ponderada de dos gaussianos?

Digamos que tengo dos distribuciones normales A y B con medias y y varianzas y . Quiero tomar una mezcla ponderada de estas dos distribuciones usando pesos y donde y . Sé que la media de esta mezcla sería .μ B σ A σ B p q 0 ≤ p ≤ 1 q = 1 - p μ A B = ( p × μ A ) + ( q × μ B...

normal-distribution mixture

39

¿Por qué la ley de los grandes números no se aplica en el caso del precio de las acciones de Apple?

Aquí está el artículo en tiempos de Nueva York llamado "Apple confronta la ley de grandes números" . Intenta explicar el aumento del precio de las acciones de Apple usando la ley de grandes números. ¿Qué errores estadísticos (o matemáticos) comete este

probability central-limit-theorem law-of-large-numbers statistics-in-media

39

Simulación de análisis de potencia de regresión logística: experimentos diseñados

Esta pregunta es en respuesta a una respuesta dada por @Greg Snow con respecto a una pregunta que hice sobre el análisis de potencia con regresión logística y SAS Proc GLMPOWER. Si estoy diseñando un experimento y analizaré los resultados en una regresión logística factorial, ¿cómo puedo usar la...

r logistic generalized-linear-model simulation power-analysis

39

¿Es necesaria la estandarización antes de ajustar la regresión logística?

Mi pregunta es si necesitamos estandarizar el conjunto de datos para asegurarnos de que todas las variables tengan la misma escala, entre [0,1], antes de ajustar la regresión logística. La formula es: Xyo- min ( xyo)max ( xyo) - min (

regression logistic standardization

39

Uso de LASSO desde el paquete lars (o glmnet) en R para la selección de variables

Lo siento si esta pregunta es un poco básica. Estoy buscando utilizar la selección de variables LASSO para un modelo de regresión lineal múltiple en R. Tengo 15 predictores, uno de los cuales es categórico (¿eso causará un problema?). Después de configurar mi e utilizo los siguientes...

feature-selection lasso glmnet lars

39

¿Deben las covariables que no son estadísticamente significativas "mantenerse" al crear un modelo?

Tengo varias covariables en mi cálculo para un modelo, y no todas son estadísticamente significativas. ¿Debo eliminar los que no lo son? Esta pregunta discute el fenómeno, pero no responde a mi pregunta: ¿Cómo interpretar el efecto no significativo de una covariable en ANCOVA? Sin embargo, no...

regression statistical-significance ancova model predictor

39

Justificación empírica de la regla de error estándar cuando se utiliza la validación cruzada

¿Existen estudios empíricos que justifiquen el uso de la única regla de error estándar a favor de la parsimonia? Obviamente, depende del proceso de generación de datos de los datos, pero cualquier cosa que analice un gran conjunto de conjuntos de datos sería una lectura muy interesante. La...

cross-validation model-selection regularization

39

Gráficos PP versus gráficos QQ

¿Cuál es la diferencia entre gráficos de probabilidad, gráficos de PP y gráficos de QQ cuando se trata de analizar una distribución ajustada a los

probability data-visualization goodness-of-fit qq-plot

39

Replicando la opción "robusta" de Stata en R

He estado tratando de replicar los resultados de la opción Stata robusten R. He utilizado el rlmcomando del paquete MASS y también el comando lmrobdel paquete "robustbase". En ambos casos, los resultados son bastante diferentes de la opción "robusta" en Stata. ¿Alguien puede sugerir algo en este...

r stata robust robust-standard-error