¿Cuáles son las similitudes y diferencias entre estos 3 métodos: Harpillera, Impulso ¿Apilado? Cuál es el mejor? ¿Y por qué? ¿Me puede dar un ejemplo para cada
¿Cuáles son las similitudes y diferencias entre estos 3 métodos: Harpillera, Impulso ¿Apilado? Cuál es el mejor? ¿Y por qué? ¿Me puede dar un ejemplo para cada
Leí que "la distancia euclidiana no es una buena distancia en grandes dimensiones". Supongo que esta afirmación tiene algo que ver con la maldición de la dimensionalidad, pero ¿qué es exactamente? Además, ¿qué son las "altas dimensiones"? He estado aplicando agrupamiento jerárquico usando la...
Quizás el concepto, por qué se usa y un
Estaba hojeando algunas notas de clase de Cosma Shalizi (en particular, la sección 2.1.1 de la segunda clase ), y me recordó que puedes obtener muy bajo incluso cuando tienes un modelo completamente lineal.R2R2R^2 Parafraseando el ejemplo de Shalizi: suponga que tiene un modelo , donde es...
Las páginas de ayuda en R suponen que sé lo que significan esos números, pero no lo sé. Estoy tratando de entender intuitivamente cada número aquí. Solo publicaré el resultado y comentaré lo que descubrí. Puede haber (habrá) errores, ya que escribiré lo que supongo. Principalmente me gustaría saber...
El intercambio de Joris y Srikant aquí me hizo preguntarme (nuevamente) si mis explicaciones internas para la diferencia entre los intervalos de confianza y los intervalos creíbles eran las correctas. ¿Cómo explicarías la
Busqué por todos lados y no he podido averiguar qué significan o significan las AUC, en relación con la
Parece que a través de varias preguntas relacionadas aquí, hay consenso en que la parte "95%" de lo que llamamos un "intervalo de confianza del 95%" se refiere al hecho de que si tuviéramos que replicar exactamente nuestros procedimientos de muestreo y cálculo de CI muchas veces , El 95% de los IC...
Soy un estudiante graduado en psicología y, a medida que realizo más y más estudios independientes en estadística, me sorprende cada vez más la insuficiencia de mi entrenamiento formal. La experiencia tanto personal como de segunda mano sugiere que la escasez de rigor estadístico en la formación de...
Al entrenar una red neuronal, qué diferencia hace establecer: tamaño del lote a y el número de iteraciones para bunaaasibb vs. tamaño de lote a y número de iteraciones a dCccredd donde ?a b = c dab=cd ab = cd Para decirlo de otra manera, suponiendo que entrenemos la red neuronal con la misma...
El AIC y el BIC son métodos para evaluar el ajuste del modelo penalizado por el número de parámetros estimados. Según tengo entendido, BIC penaliza más a los modelos por parámetros libres que AIC. Más allá de una preferencia basada en la rigurosidad de los criterios, ¿hay alguna otra razón para...
Parece que varios de los paquetes estadísticos que uso envuelven estos dos conceptos juntos. Sin embargo, me pregunto si hay diferentes supuestos o "formalidades" de datos que deben ser ciertos para usar uno sobre el otro. Un ejemplo real sería increíblemente
¿Cuál es la diferencia entre minería de datos, estadísticas, aprendizaje automático e inteligencia artificial? ¿Sería exacto decir que son 4 campos que intentan resolver problemas muy similares pero con enfoques diferentes? ¿Qué tienen exactamente en común y en qué difieren? Si hay algún tipo de...
Imagine un escenario estándar de aprendizaje automático: Te enfrentas a un gran conjunto de datos multivariado y tienes una comprensión bastante borrosa. Lo que debe hacer es hacer predicciones sobre alguna variable basada en lo que tiene. Como de costumbre, limpia los datos, mira estadísticas...
... suponiendo que pueda aumentar su conocimiento sobre la varianza de una manera intuitiva ( Entendiendo la "varianza" intuitivamente ) o diciendo: Es la distancia promedio de los valores de datos de la "media", y dado que la varianza está en cuadrado unidades, tomamos la raíz cuadrada para...
Entonces tenemos media aritmética (AM), media geométrica (GM) y media armónica (HM). Su formulación matemática también es conocida junto con sus ejemplos estereotipados asociados (p. Ej., Media armónica y su aplicación a problemas relacionados con la "velocidad"). Sin embargo, una pregunta que...
Me gustaría implementar un algoritmo para la selección automática de modelos. Estoy pensando en hacer una regresión gradual, pero cualquier cosa servirá (aunque debe basarse en regresiones lineales). Mi problema es que no puedo encontrar una metodología o una implementación de código abierto...
¿Cuál es el mejor libro de texto introductorio para las estadísticas bayesianas? Un libro por respuesta, por
Si tengo datos positivos muy sesgados, a menudo tomo registros. Pero, ¿qué debo hacer con datos no negativos muy sesgados que incluyen ceros? He visto dos transformaciones utilizadas: log(x+1)log(x+1)\log(x+1) que tiene la característica ordenada que 0 se asigna a 0. log(x+c)log(x+c)\log(x+c)...
Estoy seguro de que muchas personas responderán con enlaces para 'déjame buscar eso en Google', así que quiero decir que he tratado de resolver esto, así que perdona mi falta de comprensión aquí, pero no puedo entender cómo La implementación práctica de una red neuronal realmente funciona....