Aprendí R pero parece que las empresas están mucho más interesadas en la experiencia SAS. ¿Cuáles son las ventajas de SAS sobre
Aprendí R pero parece que las empresas están mucho más interesadas en la experiencia SAS. ¿Cuáles son las ventajas de SAS sobre
El estado del arte de la no linealidad es utilizar unidades lineales rectificadas (ReLU) en lugar de la función sigmoidea en la red neuronal profunda. ¿Cuáles son las ventajas? Sé que entrenar una red cuando se usa ReLU sería más rápido, y tiene más inspiración biológica, ¿cuáles son las otras...
Aquí está el artículo que motivó esta pregunta: ¿la impaciencia nos engorda? Me gustó este artículo, y demuestra muy bien el concepto de "controlar otras variables" (IQ, carrera, ingresos, edad, etc.) para aislar mejor la verdadera relación entre solo las 2 variables en cuestión. ¿Puede...
¿Es siempre una buena idea entrenar con el conjunto de datos completo después de la validación cruzada ? Dicho de otra manera, ¿está bien entrenar con todas las muestras en mi conjunto de datos y no poder verificar si este ajuste en particular se sobreajusta ? Algunos antecedentes sobre el...
Recibí esta pregunta durante una entrevista con Amazon: 50% de todas las personas que reciben una primera entrevista reciben una segunda entrevista El 95% de tus amigos que obtuvieron una segunda entrevista sintieron que tuvieron una buena primera entrevista El 75% de sus amigos que NO obtuvieron...
Recientemente, este documento ha recibido mucha atención (por ejemplo, de WSJ ). Básicamente, los autores concluyen que Facebook perderá el 80% de sus miembros para 2017. Basan sus afirmaciones en una extrapolación del modelo SIR , un modelo compartimental utilizado con frecuencia en...
He estado usando el -fold validación cruzada varias veces para evaluar el rendimiento de algunos algoritmos de aprendizaje, pero siempre he estado intrigados por la forma en que debería elegir el valor de .KKKKKKK A menudo he visto y usado un valor de , pero esto me parece totalmente arbitrario, y...
Actualmente estoy usando un SVM con un núcleo lineal para clasificar mis datos. No hay error en el conjunto de entrenamiento. Intenté varios valores para el parámetro ( 10 - 5 , … , 10 2 ). Esto no cambió el error en el conjunto de prueba.CCC10- 5, ... , 10210-5 5,...,10210^{-5}, \dots,...
¿En qué se diferencian PCA y MDS clásico? ¿Qué tal MDS versus MDS no métrico? ¿Hay algún momento en el que preferirías uno sobre el otro? ¿Cómo difieren las
Tengo un conjunto de datos y me gustaría averiguar qué distribución se ajusta mejor a mis datos. Utilicé la fitdistr()función para estimar los parámetros necesarios para describir la distribución supuesta (es decir, Weibull, Cauchy, Normal). Usando esos parámetros, puedo realizar una prueba de...
¿Cuáles son las funciones de costo comunes utilizadas en la evaluación del rendimiento de las redes neuronales? Detalles (siéntase libre de omitir el resto de esta pregunta, mi intención aquí es simplemente proporcionar una aclaración sobre la notación que las respuestas pueden usar para...
Esto es algo que me ha estado molestando por un tiempo, y no pude encontrar ninguna respuesta satisfactoria en línea, así que aquí va: Después de revisar un conjunto de conferencias sobre optimización convexa, el método de Newton parece ser un algoritmo muy superior al descenso de gradiente para...
Estoy leyendo un libro de minería de datos y menciona la estadística Kappa como un medio para evaluar el rendimiento de predicción de los clasificadores. Sin embargo, simplemente no puedo entender esto. También revisé Wikipedia, pero tampoco me ayudó: https://en.wikipedia.org/wiki/Cohen's_kappa...
En un artículo reciente de Amstat News , los autores (Mark van der Laan y Sherri Rose) declararon que "Sabemos que para tamaños de muestra lo suficientemente grandes, cada estudio, incluidos aquellos en los que la hipótesis nula de ningún efecto es verdadera, declarará un efecto estadísticamente...
Estoy estudiando el reconocimiento de patrones y las estadísticas y casi todos los libros que abro sobre el tema me encuentro con el concepto de distancia de Mahalanobis . Los libros dan una especie de explicaciones intuitivas, pero aún no son lo suficientemente buenas para que yo realmente...
Los bosques aleatorios se consideran cajas negras, pero recientemente estaba pensando qué conocimiento se puede obtener de un bosque aleatorio. Lo más obvio es la importancia de las variables, en la variante más simple se puede hacer simplemente calculando el número de ocurrencias de una variable....
Me preguntaba cuál es la diferencia entre la varianza y la desviación estándar. Si calcula los dos valores, está claro que obtiene la desviación estándar de la varianza, pero ¿qué significa eso en términos de la distribución que está observando? Además, ¿por qué realmente necesitas una...
En un grupo de estudiantes, hay 2 de 18 que son zurdos. Encuentre la distribución posterior de los estudiantes zurdos en la población suponiendo que no haya información previa. Resume los resultados. Según la literatura, 5-20% de las personas son zurdas. Tenga en cuenta esta información en su...
Estoy realmente sorprendido de que nadie parece haber preguntado esto ya ... Cuando se discuten los estimadores, dos términos utilizados con frecuencia son "consistente" e "imparcial". Mi pregunta es simple: ¿cuál es la diferencia? Las definiciones técnicas precisas de estos términos son bastante...
Recientemente he estado leyendo sobre el aprendizaje profundo y estoy confundido acerca de los términos (o decir tecnologías). Cuál es la diferencia entre Redes neuronales convolucionales (CNN), Máquinas de Boltzmann restringidas (RBM) y Codificadores