Estadísticas y Big Data

15
¿Cómo interpretar la entropía diferencial?

Recientemente leí este artículo sobre la entropía de una distribución de probabilidad discreta. Describe una buena manera de pensar en la entropía como los bits de número esperados (al menos cuando se usa en su definición de entropía) necesarios para codificar un mensaje cuando su codificación es...

15
Buena precisión a pesar del alto valor de pérdida

Durante el entrenamiento de un clasificador binario de red neuronal simple obtengo un alto valor de pérdida, usando entropía cruzada. A pesar de esto, el valor de precisión en el conjunto de validación es bastante bueno. ¿Tiene algún significado? ¿No hay una correlación estricta entre pérdida y...

15
¿Es una trampa descartar los valores atípicos basados ​​en el diagrama de caja de Error absoluto medio para mejorar un modelo de regresión?

Tengo un modelo de predicción probado con cuatro métodos, como puede ver en la figura del diagrama de caja a continuación. El atributo que predice el modelo está en el rango de 0-8. Puede notar que hay un valor atípico de límite superior y tres valores atípicos de límite inferior indicados por...

15
Cero distribuciones infladas, ¿qué son realmente?

Estoy luchando por comprender las distribuciones infladas cero. ¿Qué son? ¿Cuál es el punto de? Si tengo datos con muchos ceros, entonces podría ajustar una regresión logística primero calcular la probabilidad de ceros, y luego podría eliminar todos los ceros, y luego ajustar una regresión regular...

15
¿Por qué necesita escalar datos en KNN?

¿Podría alguien explicarme por qué necesita normalizar los datos cuando usa K vecinos más cercanos? He intentado buscar esto, pero parece que todavía no puedo entenderlo. Encontré el siguiente enlace: https://discuss.analyticsvidhya.com/t/why-it-is-necessary-to-normalize-in-knn/2715 Pero en...

15
¿Qué significa "en realidad" la varianza agrupada?

Soy un novato en estadísticas, así que ¿podrían ayudarme aquí? Mi pregunta es la siguiente: ¿Qué significa realmente la varianza agrupada ? Cuando busco una fórmula para la varianza agrupada en Internet, encuentro mucha literatura usando la siguiente fórmula (por ejemplo, aquí:...