Estadísticas y Big Data

143

R vs SAS, ¿por qué las empresas privadas prefieren SAS?

Aprendí R pero parece que las empresas están mucho más interesadas en la experiencia SAS. ¿Cuáles son las ventajas de SAS sobre

r sas

141

¿Cuáles son las ventajas de ReLU sobre la función sigmoidea en redes neuronales profundas?

El estado del arte de la no linealidad es utilizar unidades lineales rectificadas (ReLU) en lugar de la función sigmoidea en la red neuronal profunda. ¿Cuáles son las ventajas? Sé que entrenar una red cuando se usa ReLU sería más rápido, y tiene más inspiración biológica, ¿cuáles son las otras...

machine-learning neural-networks deep-learning

141

¿Cómo exactamente uno "controla para otras variables"?

Aquí está el artículo que motivó esta pregunta: ¿la impaciencia nos engorda? Me gustó este artículo, y demuestra muy bien el concepto de "controlar otras variables" (IQ, carrera, ingresos, edad, etc.) para aislar mejor la verdadera relación entre solo las 2 variables en cuestión. ¿Puede...

regression causality confounding controlling-for-a-variable statistics-in-media

140

¿Entrenamiento con el conjunto de datos completo después de la validación cruzada?

¿Es siempre una buena idea entrenar con el conjunto de datos completo después de la validación cruzada ? Dicho de otra manera, ¿está bien entrenar con todas las muestras en mi conjunto de datos y no poder verificar si este ajuste en particular se sobreajusta ? Algunos antecedentes sobre el...

machine-learning cross-validation model-selection

139

Pregunta de la entrevista de Amazon: probabilidad de la segunda entrevista

Recibí esta pregunta durante una entrevista con Amazon: 50% de todas las personas que reciben una primera entrevista reciben una segunda entrevista El 95% de tus amigos que obtuvieron una segunda entrevista sintieron que tuvieron una buena primera entrevista El 75% de sus amigos que NO obtuvieron...

probability conditional-probability

138

¿Facebook está llegando a su fin?

Recientemente, este documento ha recibido mucha atención (por ejemplo, de WSJ ). Básicamente, los autores concluyen que Facebook perderá el 80% de sus miembros para 2017. Basan sus afirmaciones en una extrapolación del modelo SIR , un modelo compartimental utilizado con frecuencia en...

hypothesis-testing correlation epidemiology social-network

136

Elección de K en validación cruzada K-fold

He estado usando el -fold validación cruzada varias veces para evaluar el rendimiento de algunos algoritmos de aprendizaje, pero siempre he estado intrigados por la forma en que debería elegir el valor de .KKKKKKK A menudo he visto y usado un valor de , pero esto me parece totalmente arbitrario, y...

machine-learning classification cross-validation

134

¿Cuál es la influencia de C en SVM con núcleo lineal?

Actualmente estoy usando un SVM con un núcleo lineal para clasificar mis datos. No hay error en el conjunto de entrenamiento. Intenté varios valores para el parámetro ( 10 - 5 , … , 10 2 ). Esto no cambió el error en el conjunto de prueba.CCC10- 5, ... , 10210-5 5,...,10210^{-5}, \dots,...

machine-learning svm libsvm

133

¿Cuál es la diferencia entre el análisis de componentes principales y el escalado multidimensional?

¿En qué se diferencian PCA y MDS clásico? ¿Qué tal MDS versus MDS no métrico? ¿Hay algún momento en el que preferirías uno sobre el otro? ¿Cómo difieren las

pca multidimensional-scaling pcoa

133

¿Cómo determinar qué distribución se ajusta mejor a mis datos?

Tengo un conjunto de datos y me gustaría averiguar qué distribución se ajusta mejor a mis datos. Utilicé la fitdistr()función para estimar los parámetros necesarios para describir la distribución supuesta (es decir, Weibull, Cauchy, Normal). Usando esos parámetros, puedo realizar una prueba de...

r distributions goodness-of-fit kolmogorov-smirnov distribution-identification

133

Una lista de funciones de costo utilizadas en redes neuronales, junto con aplicaciones

¿Cuáles son las funciones de costo comunes utilizadas en la evaluación del rendimiento de las redes neuronales? Detalles (siéntase libre de omitir el resto de esta pregunta, mi intención aquí es simplemente proporcionar una aclaración sobre la notación que las respuestas pueden usar para...

machine-learning neural-networks

132

¿Por qué el método de Newton no se usa ampliamente en el aprendizaje automático?

Esto es algo que me ha estado molestando por un tiempo, y no pude encontrar ninguna respuesta satisfactoria en línea, así que aquí va: Después de revisar un conjunto de conferencias sobre optimización convexa, el método de Newton parece ser un algoritmo muy superior al descenso de gradiente para...

machine-learning optimization gradient-descent hessian

131

Kappa de Cohen en inglés simple

Estoy leyendo un libro de minería de datos y menciona la estadística Kappa como un medio para evaluar el rendimiento de predicción de los clasificadores. Sin embargo, simplemente no puedo entender esto. También revisé Wikipedia, pero tampoco me ayudó: https://en.wikipedia.org/wiki/Cohen's_kappa...

classification data-mining cohens-kappa

129

¿Son inapropiados los grandes conjuntos de datos para la prueba de hipótesis?

En un artículo reciente de Amstat News , los autores (Mark van der Laan y Sherri Rose) declararon que "Sabemos que para tamaños de muestra lo suficientemente grandes, cada estudio, incluidos aquellos en los que la hipótesis nula de ningún efecto es verdadera, declarará un efecto estadísticamente...

hypothesis-testing sample-size dataset large-data

127

¿Explicación de abajo a arriba de la distancia de Mahalanobis?

Estoy estudiando el reconocimiento de patrones y las estadísticas y casi todos los libros que abro sobre el tema me encuentro con el concepto de distancia de Mahalanobis . Los libros dan una especie de explicaciones intuitivas, pero aún no son lo suficientemente buenas para que yo realmente...

normal-distribution mathematical-statistics distance pattern-recognition intuition

127

Obteniendo conocimiento de un bosque aleatorio

Los bosques aleatorios se consideran cajas negras, pero recientemente estaba pensando qué conocimiento se puede obtener de un bosque aleatorio. Lo más obvio es la importancia de las variables, en la variante más simple se puede hacer simplemente calculando el número de ocurrencias de una variable....

machine-learning data-mining interaction random-forest cart

127

¿Cuál es la diferencia entre la varianza y la desviación estándar?

Me preguntaba cuál es la diferencia entre la varianza y la desviación estándar. Si calcula los dos valores, está claro que obtiene la desviación estándar de la varianza, pero ¿qué significa eso en términos de la distribución que está observando? Además, ¿por qué realmente necesitas una...

variance mathematical-statistics standard-deviation

125

Ayúdame a comprender las distribuciones bayesianas anteriores y posteriores

En un grupo de estudiantes, hay 2 de 18 que son zurdos. Encuentre la distribución posterior de los estudiantes zurdos en la población suponiendo que no haya información previa. Resume los resultados. Según la literatura, 5-20% de las personas son zurdas. Tenga en cuenta esta información en su...

distributions bayesian prior posterior

125

¿Cuál es la diferencia entre un estimador consistente y un estimador imparcial?

Estoy realmente sorprendido de que nadie parece haber preguntado esto ya ... Cuando se discuten los estimadores, dos términos utilizados con frecuencia son "consistente" e "imparcial". Mi pregunta es simple: ¿cuál es la diferencia? Las definiciones técnicas precisas de estos términos son bastante...

unbiased-estimator estimators consistency

123

¿Cuál es la diferencia entre redes neuronales convolucionales, máquinas de Boltzmann restringidas y codificadores automáticos?

Recientemente he estado leyendo sobre el aprendizaje profundo y estoy confundido acerca de los términos (o decir tecnologías). Cuál es la diferencia entre Redes neuronales convolucionales (CNN), Máquinas de Boltzmann restringidas (RBM) y Codificadores

neural-networks deep-learning conv-neural-network autoencoders rbm