¿Por qué la regresión logística se vuelve inestable cuando las clases están bien separadas? ¿Qué significan las clases bien separadas? Realmente agradecería si alguien puede explicar con un
¿Por qué la regresión logística se vuelve inestable cuando las clases están bien separadas? ¿Qué significan las clases bien separadas? Realmente agradecería si alguien puede explicar con un
En una asignación reciente, nos dijeron que usáramos PCA en los dígitos MNIST para reducir las dimensiones de 64 (imágenes de 8 x 8) a 2. Luego tuvimos que agrupar los dígitos usando un Modelo de Mezcla Gaussiana. La PCA que usa solo 2 componentes principales no produce grupos distintos y, como...
Digamos que estoy estudiando cómo los narcisos responden a diversas condiciones del suelo. He recopilado datos sobre el pH del suelo frente a la altura madura del narciso. Espero una relación lineal, así que hago una regresión lineal. Sin embargo, cuando comencé mi estudio, no me di cuenta de que...
En muchos métodos estadísticos diferentes hay un "supuesto de normalidad". ¿Qué es "normalidad" y cómo sé si hay
Mi padre es un entusiasta de las matemáticas, pero no le interesan mucho las estadísticas. Sería genial tratar de ilustrar algunos de los maravillosos datos estadísticos, y el CLT es un candidato excelente. ¿Cómo transmitirías la belleza matemática y el impacto del teorema del límite central a un...
Estoy buscando un buen libro / tutorial para aprender sobre el análisis de supervivencia. También estoy interesado en referencias sobre análisis de supervivencia en
¿Entonces qué? ¿Si no, porque no? Para una muestra en la línea, la mediana minimiza la desviación absoluta total. Parece natural extender la definición a R2, etc., pero nunca la he visto. Pero entonces, he estado en el jardín izquierdo durante mucho
Entiendo que para ciertos conjuntos de datos, como votar, funciona mejor. ¿Por qué se usa la regresión de Poisson sobre la regresión lineal ordinaria o la regresión logística? ¿Cuál es la motivación matemática para
Estoy a punto de ayudar a enseñar estadísticas a estudiantes de medicina este semestre. He escuchado muchas historias de terror sobre el miedo de estos estudiantes al aprender estadísticas. ¿Alguien puede sugerir qué hacer con este miedo? (Puede vincular a personas que están discutiendo esto u...
Digamos que tenemos una variable aleatoria con varianza y media conocidas. La pregunta es: ¿cuál es la varianza de para alguna función dada f. El único método general que conozco es el método delta, pero solo da una aproximación. Ahora estoy interesado en , pero también sería bueno conocer algunos...
Dados dos histogramas, ¿cómo evaluamos si son similares o no? ¿Es suficiente simplemente mirar los dos histogramas? El mapeo simple uno a uno tiene el problema de que si un histograma es ligeramente diferente y ligeramente cambiado, no obtendremos el resultado deseado. ¿Alguna...
Estoy tratando de entender el error estándar "agrupamiento" y cómo ejecutarlo en R (es trivial en Stata). En RI no he tenido éxito usando plmo escribiendo mi propia función. Usaré los diamondsdatos del ggplot2paquete. Puedo hacer efectos fijos con variables ficticias > library(plyr) >...
¿Me gustaría saber si hay una variante de diagrama de caja adaptada a los datos distribuidos de Poisson (o posiblemente otras distribuciones)? Con una distribución gaussiana, los bigotes colocados en L = Q1 - 1.5 IQR y U = Q3 + 1.5 IQR, el diagrama de caja tiene la propiedad de que habrá...
Andrew More define la ganancia de información como: IG(Y|X)=H(Y)−H(Y|X)IG(Y|X)=H(Y)−H(Y|X)IG(Y|X) = H(Y) - H(Y|X) donde es la entropía condicional . Sin embargo, Wikipedia llama a la cantidad anterior información mutua .H(Y|X)H(Y|X)H(Y|X) Wikipedia, por otro lado, define la ganancia de...
Tengo cuatro series temporales diferentes de mediciones por hora: El consumo de calor dentro de una casa. La temperatura fuera de la casa La radiación solar La velocidad del viento Quiero poder predecir el consumo de calor dentro de la casa. Existe una clara tendencia estacional, tanto...
Soy nuevo en el modelado con redes neuronales, pero logré establecer una red neuronal con todos los puntos de datos disponibles que se ajustan bien a los datos observados. La red neuronal se realizó en R con el paquete nnet: require(nnet) ##33.8 is the highest value mynnet.fit <-...
He escrito un programa de computadora que puede detectar monedas en una imagen estática (.jpeg, .png, etc.) usando algunas técnicas estándar para la visión por computadora (Desenfoque gaussiano, umbral, Transformación de Hough, etc.). Utilizando las proporciones de las monedas recogidas de una...
Recientemente aprendí sobre el uso de técnicas de arranque para calcular errores estándar e intervalos de confianza para estimadores. Lo que aprendí fue que si los datos son IID, puede tratar los datos de la muestra como la población, y hacer un muestreo con reemplazo y esto le permitirá obtener...
Tengo un conjunto de datos de transmisión, los ejemplos están disponibles uno a la vez. Tendría que hacer una clasificación de clases múltiples en ellos. Tan pronto como introduje un ejemplo de capacitación en el proceso de aprendizaje, tengo que descartar el ejemplo. Al mismo tiempo, también estoy...
Una de las contribuciones tardías de RA Fisher fueron los intervalos fiduciales y los argumentos de principios fiduciales . Sin embargo, este enfoque no es tan popular como los argumentos de principios bayesianos o frecuentistas. ¿Cuál es el argumento fiducial y por qué no se ha...