Estadísticas y Big Data

69

¿Qué se entiende por "variable aleatoria"?

¿Qué quieren decir cuando dicen "variable aleatoria"?

69

¿Por qué los investigadores de redes neuronales se preocupan por las épocas?

Una época en el descenso de gradiente estocástico se define como un solo paso a través de los datos. Para cada minibatch SGD, se extraen muestras, se calcula el gradiente y se actualizan los parámetros. En la configuración de época, las muestras se extraen sin reemplazo.kkk Pero esto parece...

neural-networks deep-learning gradient-descent

69

¿Cómo ajustar los hiperparámetros de los árboles xgboost?

Tengo una clase de datos desequilibrados y quiero ajustar los hiperparámetros del trenzado reforzado usando xgboost. Preguntas ¿Hay un equivalente de gridsearchcv o randomsearchcv para xgboost? Si no, ¿cuál es el enfoque recomendado para ajustar los parámetros de

machine-learning cross-validation xgboost boosting

69

¿Cómo difiere el coeficiente de correlación de la pendiente de regresión?

Hubiera esperado que el coeficiente de correlación fuera el mismo que una pendiente de regresión (beta), sin embargo, al comparar los dos, son diferentes. ¿Cómo difieren? ¿Qué información diferente

regression correlation

69

Forma del intervalo de confianza para valores predichos en regresión lineal

He notado que el intervalo de confianza para los valores pronosticados en una regresión lineal tiende a ser estrecho alrededor de la media del predictor y engordar alrededor de los valores mínimos y máximos del predictor. Esto se puede ver en las gráficas de estas 4 regresiones...

regression confidence-interval linear-model standard-error prediction-interval

69

¿Kendall Tau o el rho de Spearman?

¿En qué casos uno debería preferir el uno sobre el otro? Encontré a alguien que reclama una ventaja para Kendall, por razones pedagógicas , ¿hay otras

correlation nonparametric spearman-rho kendall-tau

68

¿Qué hay de malo con la extrapolación?

Recuerdo estar sentado en cursos de estadísticas como una audiencia de pregrado sobre por qué la extrapolación era una mala idea. Además, hay una variedad de fuentes en línea que comentan sobre esto. También hay una mención de esto aquí . ¿Alguien puede ayudarme a entender por qué la extrapolación...

regression time-series forecasting

68

¿Cómo 'sumar' una desviación estándar?

Tengo un promedio mensual para un valor y una desviación estándar correspondiente a ese promedio. Ahora estoy calculando el promedio anual como la suma de los promedios mensuales, ¿cómo puedo representar la desviación estándar para el promedio sumado? Por ejemplo, considerando la producción de un...

standard-deviation descriptive-statistics

68

¿Se necesita realmente una selección variable para el modelado predictivo en 2016?

Esta pregunta se hizo en CV hace algunos años, parece que vale la pena volver a publicar a la luz de 1) orden de magnitud mejor tecnología informática (por ejemplo, computación paralela, HPC, etc.) y 2) técnicas más nuevas, por ejemplo [3]. Primero, un poco de contexto. Supongamos que el objetivo...

machine-learning modeling feature-selection model-selection prediction

68

Regresión múltiple multivariante en R

Tengo 2 variables dependientes (DV), cada una de cuyas puntuaciones puede estar influenciada por el conjunto de 7 variables independientes (IV). Los DV son continuos, mientras que el conjunto de IV consiste en una mezcla de variables codificadas continuas y binarias. (En el siguiente código, las...

r multivariate-analysis manova multiple-regression multivariate-regression

68

¿Todos los términos de interacción necesitan sus términos individuales en el modelo de regresión?

En realidad estoy revisando un manuscrito donde los autores comparan modelos de regresión de 5-6 logit con AIC. Sin embargo, algunos de los modelos tienen términos de interacción sin incluir los términos covariables individuales. ¿Tiene sentido hacer esto? Por ejemplo (no específico para los...

regression modeling interaction aic

68

¿Cómo generar puntos distribuidos uniformemente en la superficie de la esfera de la unidad tridimensional?

Me pregunto cómo generar puntos uniformemente distribuidos en la superficie de la esfera de la unidad tridimensional. Además, después de generar esos puntos, ¿cuál es la mejor manera de visualizar y verificar si son realmente uniformes en la superficie

random-generation

68

¿Cuáles son los buenos pesos iniciales en una red neuronal?

Acabo de escuchar que es una buena idea elegir los pesos iniciales de una red neuronal del rango , donde es el cantidad de entradas a una neurona dada. Se supone que los conjuntos están normalizados: media 0, varianza 1 (no sé si esto importa).d( - 1re√, 1re√)(−1d,1d)(\frac{-1}{\sqrt d} ,...

neural-networks normalization

68

¿Por qué debería ser bayesiano cuando mi modelo está equivocado?

Ediciones: He agregado un ejemplo simple: inferencia de la media de la XyoXyoX_i . También he aclarado ligeramente por qué los intervalos creíbles que no coinciden con los intervalos de confianza son malos. Yo, un bayesiano bastante devoto, estoy en medio de una especie de crisis de fe. Mi...

bayesian modeling philosophical misspecification

67

¿Cuáles son buenas estadísticas básicas para usar para datos ordinales?

Tengo algunos datos ordinales obtenidos de las preguntas de la encuesta. En mi caso, son respuestas de estilo Likert (Muy en desacuerdo-En desacuerdo-Neutral-De acuerdo-Muy de acuerdo). En mis datos están codificados como 1-5. No creo que los medios signifiquen mucho aquí, entonces, ¿qué resumen...

descriptive-statistics likert ordinal-data

67

¿Qué hace que el núcleo gaussiano sea tan mágico para PCA, y también en general?

Estaba leyendo sobre kernel PCA ( 1 , 2 , 3 ) con núcleos gaussianos y polinomiales. ¿Cómo separa el núcleo gaussiano aparentemente cualquier tipo de datos no lineales excepcionalmente bien? Realice un análisis intuitivo, así como uno matemáticamente involucrado si es posible. ¿Cuál es una...

machine-learning pca svm kernel-trick

67

Forma adecuada de usar la red neuronal recurrente para el análisis de series temporales

Las redes neuronales recurrentes difieren de las "regulares" por el hecho de que tienen una capa de "memoria". Debido a esta capa, se supone que los NN recurrentes son útiles en el modelado de series temporales. Sin embargo, no estoy seguro de entender correctamente cómo usarlos. Digamos que tengo...

time-series machine-learning neural-networks

67

¿Cuándo usar un desplazamiento en una regresión de Poisson?

¿Alguien sabe por qué se utiliza la compensación en una regresión de Poisson? ¿Qué logras con

poisson-regression offset

67

¿Cómo aceptaron exactamente los estadísticos utilizar (n-1) como estimador imparcial de la varianza de la población sin simulación?

La fórmula para calcular la varianza tiene en el denominador:(n−1)(n−1)(n-1) s2=∑Ni=1(xi−x¯)2n−1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} Siempre me he preguntado por qué. Sin embargo, leer y ver algunos buenos videos sobre "por qué" es, al parecer, es un buen estimador...

variance unbiased-estimator proof history

67

Convergencia en probabilidad vs. convergencia casi segura

Nunca he asimilado la diferencia entre estas dos medidas de convergencia. (O, de hecho, cualquiera de los diferentes tipos de convergencia, pero menciono estos dos en particular debido a las leyes débiles y fuertes de los números grandes). Claro, puedo citar la definición de cada uno y dar un...

probability random-variable