Estadísticas y Big Data

15

¿Podemos usar una variable independiente categórica en el análisis discriminante?

En el análisis discriminante, la variable dependiente es categórica, pero ¿puedo usar una variable categórica (por ejemplo, estado residencial: rural, urbano) junto con alguna otra variable continua como variable independiente en el análisis discriminante

15

¿Cuál es una longitud de secuencia factible para un modelo RNN?

Estoy investigando el uso de una versión LSTM ( memoria a largo plazo ) de una red neuronal recurrente (RNN) para modelar datos de series temporales. A medida que aumenta la longitud de la secuencia de los datos, aumenta la complejidad de la red. Por lo tanto, tengo curiosidad por saber qué...

neural-networks deep-learning lstm

15

Métricas para evaluar algoritmos de clasificación

Estoy interesado en ver varias métricas diferentes para los algoritmos de clasificación: hay algunas que figuran en la página de Wikipedia de Learning to Rank, que incluyen: • Precisión media promedio (MAP); • DCG y NDCG; • Precisión @ n, NDCG @ n, donde "@n" indica que las métricas se evalúan...

algorithms ranking

15

Comprender la descomposición QR

Tengo un ejemplo trabajado (en R), que estoy tratando de entender más. Estoy usando Limma para crear un modelo lineal y estoy tratando de entender lo que sucede paso a paso en los cálculos de cambio de pliegue. Principalmente estoy tratando de averiguar qué sucede para calcular los coeficientes....

r regression linear-model

15

¿Qué medida de error de entrenamiento reportar para bosques aleatorios?

Actualmente estoy ajustando bosques aleatorios para un problema de clasificación usando el randomForestpaquete en R, y no estoy seguro de cómo informar un error de entrenamiento para estos modelos. Mi error de entrenamiento es cercano al 0% cuando lo calculo usando predicciones que obtengo con el...

r machine-learning classification random-forest overfitting

15

Kernel SVM: quiero una comprensión intuitiva de la asignación a un espacio de características de dimensiones superiores, y cómo esto hace posible la separación lineal

Estoy tratando de entender la intuición detrás de los SVM del kernel. Ahora, entiendo cómo funciona el SVM lineal, mediante el cual se toma una línea de decisión que divide los datos lo mejor que puede. También entiendo el principio detrás de la transferencia de datos a un espacio de dimensiones...

machine-learning svm kernel-trick

15

¿Cuál es la conexión entre la cadena de Markov y la cadena de Markov Monte Carlo?

Estoy tratando de entender las cadenas de Markov usando SAS. Entiendo que un proceso de Markov es uno en el que el estado futuro depende solo del estado actual y no del estado pasado y hay una matriz de transición que captura la probabilidad de transición de un estado a otro. Pero luego me...

probability simulation mcmc monte-carlo markov-process

15

¿A qué nivel es una prueba

ANTECEDENTES: Salte con seguridad: está aquí como referencia y para legitimar la pregunta. La apertura de este documento dice: "Famosa prueba de contingencia chi-cuadrado de Karl Pearson se deriva de otra estadística, llamada la estadística z, basado en la distribución Normal. Las versiones más...

chi-squared proportion z-test

15

¿Puede un modelo para datos no negativos con aglomeración en ceros (Tweedie GLM, GLM inflado a cero, etc.) predecir ceros exactos?

Una distribución Tweedie puede modelar datos asimétricos con una masa de punto en cero cuando el parámetro ppagp (exponente en la relación media-varianza) está entre 1 y 2. Del mismo modo, un modelo inflado a cero (ya sea continuo o discreto) puede tener una gran cantidad de ceros. Tengo...

r generalized-linear-model prediction zero-inflation tweedie-distribution

15

¿Cómo se actualizan los pesos en el método de aprendizaje por lotes en redes neuronales?

¿Alguien puede decirme cómo se supone que debo construir una red neuronal utilizando el método por lotes? He leído que, en el modo por lotes, para todas las muestras en el conjunto de entrenamiento, calculamos el error, los delta y, por lo tanto, los pesos delta para cada neurona en la red y...

machine-learning neural-networks

15

¿Cuál es la distribución de varios dados poliédricos todos tirados a la vez?

Tome los 5 sólidos platónicos de un conjunto de dados de Dungeons & Dragons. Estos consisten en un dado de 4 lados, 6 lados (convencional), 8 lados, 12 lados y 20 lados. Todos comienzan en el número 1 y cuentan hacia arriba en 1 hasta su total. Tira todos a la vez, toma su suma (la suma mínima...

distributions dice

15

Si "Error estándar" e "Intervalos de confianza" miden la precisión de la medición, ¿cuáles son las mediciones de precisión?

En el libro "Bioestadística para tontos" en la página 40 leí: El error estándar (SE abreviado) es una forma de indicar qué tan precisa es su estimación o medición de algo. y Los intervalos de confianza proporcionan otra forma de indicar la precisión de una estimación o medición de...

confidence-interval standard-error measurement-error accuracy

15

Alta variación de validación cruzada de dejar uno fuera

Leí una y otra vez que la validación cruzada "Leave-one-out" tiene una gran variación debido a la gran superposición de los pliegues de entrenamiento. Sin embargo, no entiendo por qué es así: ¿no debería ser el rendimiento de la validación cruzada muy estable (baja variación) exactamente porque los...

variance cross-validation bias

15

¿Cuándo dejar de refinar un modelo?

He estado estudiando estadísticas de muchos libros durante los últimos 3 años, y gracias a este sitio aprendí mucho. Sin embargo, una pregunta fundamental sigue sin respuesta para mí. Puede tener una respuesta muy simple o muy difícil, pero sé con certeza que requiere una comprensión profunda de...

modeling inference aic

15

El pdf de

Supongamos que X1,X2,...,XnX1,X2,...,XnX_1, X_2,...,X_n se iid de N(μ,σ2)N(μ,σ2)N(\mu,\sigma^2) con desconocido μ∈Rμ∈R\mu \in \mathcal Ry σ2>0σ2>0\sigma^2>0 Deje Z=X1−X¯S,Z=X1−X¯S,Z=\frac{X_1-\bar{X}}{S},S es la desviación estándar aquí. Se puede demostrar que ZZZ tiene el pdf de...

self-study umvue

15

Comprender los cálculos de correlación de distancia

Según tengo entendido, la correlación de distancia es una forma robusta y universal de verificar si existe una relación entre dos variables numéricas. Por ejemplo, si tenemos un conjunto de pares de números: (x1, y1) (x2, y2) ... (xn, yn) Podemos usar la correlación de distancia para verificar...

correlation independence intuition distance-covariance

15

¿Suma o promedio de gradientes en (mini) gradiente de lote decente?

Cuando implementé el mini lote de gradiente decente, solo promedié los gradientes de todos los ejemplos en el lote de capacitación. Sin embargo, me di cuenta de que ahora la tasa de aprendizaje óptima es mucho más alta que para el gradiente en línea decente. Mi intuición es que esto se debe a que...

neural-networks gradient-descent backpropagation

15

Problema de parámetro incidental

Siempre lucho por obtener la verdadera esencia del problema de los parámetros incidentales. Leí en varias ocasiones que los estimadores de efectos fijos de los modelos de datos de panel no lineales pueden estar severamente sesgados debido al problema de parámetro incidental "bien conocido". Cuando...

nonlinear-regression fixed-effects-model bias

15

¿La maldición de la dimensionalidad afecta a algunos modelos más que a otros?

Los lugares que he estado leyendo sobre la maldición de la dimensionalidad lo explican conjuntamente con kNN principalmente, y los modelos lineales en general. Regularmente veo a los mejores clasificados en Kaggle usando miles de características en el conjunto de datos que apenas tiene 100k puntos...

neural-networks svm k-means k-nearest-neighbour high-dimensional

15

ROC promedio para validación cruzada repetida 10 veces con estimaciones de probabilidad

Estoy planeando usar validación cruzada estratificada repetida (10 veces) en aproximadamente 10,000 casos usando el algoritmo de aprendizaje automático. Cada vez que la repetición se realizará con diferentes semillas al azar. En este proceso, creo 10 instancias de estimaciones de probabilidad...

roc