Sé que la correlación no implica causalidad, pero ¿la ausencia de correlación implica ausencia de
Sé que la correlación no implica causalidad, pero ¿la ausencia de correlación implica ausencia de
Muchas veces un analista estadístico recibe un conjunto de datos y se le pide que se ajuste a un modelo utilizando una técnica como la regresión lineal. Con mucha frecuencia, el conjunto de datos va acompañado de una exención de responsabilidad similar a "Oh, sí, nos equivocamos al recopilar...
En los últimos años, las redes neuronales convolucionales (o quizás redes neuronales profundas en general) se han vuelto cada vez más profundas, con redes de vanguardia que van de 7 capas ( AlexNet ) a 1000 capas ( Redes residuales) en el espacio de 4 años. La razón detrás del aumento en el...
He leído en el resumen de este artículo que: "El procedimiento de máxima verosimilitud (ML) de Hartley aud Rao se modifica adaptando una transformación de Patterson y Thompson que divide la probabilidad de normalizar en dos partes, una libre de los efectos fijos. Maximizar esta parte produce lo...
Inspirado por un comentario de esta pregunta : ¿Qué consideramos "no informativo" en un previo, y qué información todavía está contenida en un previo supuestamente no informativo? En general, veo lo anterior en un análisis en el que es un análisis de tipo frecuentista que intenta tomar prestadas...
El video musical de PSY "Gangnam style" es popular, después de poco más de 2 meses tiene alrededor de 540 millones de espectadores. Aprendí esto de mis hijos preadolescentes durante la cena la semana pasada y pronto la discusión fue en dirección a si era posible hacer algún tipo de predicción de...
Hay varios usos distintos: estimación de la densidad del grano truco del grano suavizado de granos Por favor explique lo que significa el "núcleo" en ellos, en inglés simple, en sus propias
Cuando se utiliza el análisis de conglomerados en un conjunto de datos para agrupar casos similares, es necesario elegir entre una gran cantidad de métodos de agrupamiento y medidas de distancia. A veces, una opción puede influir en la otra, pero hay muchas combinaciones posibles de métodos....
He estado muy interesado en la minería de datos y el aprendizaje automático por un tiempo, en parte porque me especialicé en esa área en la escuela, pero también porque estoy realmente mucho más emocionado tratando de resolver problemas que requieren un poco más de pensamiento que solo programar...
A pesar de que todas las imágenes en el conjunto de datos MNIST están centradas, con una escala similar y boca arriba sin rotaciones, tienen una variación significativa en la escritura a mano que me desconcierta cómo un modelo lineal logra una precisión de clasificación tan alta. Hasta donde puedo...
Últimamente he estado leyendo mucho sobre las diferencias entre el método de prueba de hipótesis de Fisher y la escuela de pensamiento de Neyman-Pearson. Mi pregunta es, ignorando las objeciones filosóficas por un momento; ¿Cuándo deberíamos usar el enfoque de Fisher de modelado estadístico y...
El 25 de febrero de 2015, la revista Basic and Applied Social Psychology emitió un editorial que prohíbe los valores ppp y los intervalos de confianza de todos los trabajos futuros. Específicamente, dicen (el formato y el énfasis son míos): [...] antes de la publicación, los autores deberán...
¿Existe alguna GUI para R que facilite que un principiante comience a aprender y programar en ese
Me pregunto cómo calcular las medidas de precisión y recuperación para la clasificación multiclase multicabel, es decir, la clasificación donde hay más de dos etiquetas y cada instancia puede tener varias
¿Cuáles son los supuestos habituales para la regresión lineal? ¿Incluyen: Una relación lineal entre la variable independiente y la dependiente errores independientes distribución normal de errores homocedasticidad ¿Hay
Antecedentes : no tengo una capacitación formal en estadísticas bayesianas (aunque estoy muy interesado en aprender más), pero sé lo suficiente, creo, para entender por qué muchos sienten que son preferibles a las estadísticas frequentistas. Incluso los estudiantes de pregrado en la clase de...
He visto en alguna parte que las distancias clásicas (como la distancia euclidiana) se vuelven débilmente discriminantes cuando tenemos datos multidimensionales y escasos. ¿Por qué? ¿Tiene un ejemplo de dos vectores de datos dispersos donde la distancia euclidiana no funciona bien? En este caso,...
Los tiempos de espera para la distribución de Poisson es una distribución exponencial con parámetro lambda. Pero no lo entiendo. Poisson modela el número de llegadas por unidad de tiempo, por ejemplo. ¿Cómo se relaciona esto con la distribución exponencial? Digamos que la probabilidad de que k...
La entropía de Shannon es el negativo de la suma de las probabilidades de cada resultado multiplicado por el logaritmo de probabilidades para cada resultado. ¿Para qué sirve el logaritmo en esta ecuación? ¡Una respuesta intuitiva o visual (a diferencia de una respuesta profundamente matemática)...
En el curso de aprendizaje automático de Andrew Ng , introduce la regresión lineal y la regresión logística, y muestra cómo ajustar los parámetros del modelo utilizando el descenso de gradiente y el método de Newton. Sé que el descenso de gradiente puede ser útil en algunas aplicaciones de...