Preguntas etiquetadas con classification

43
Suposiciones aleatorias del bosque

Soy un poco nuevo en el bosque aleatorio, así que todavía estoy luchando con algunos conceptos básicos. En regresión lineal, asumimos observaciones independientes, varianza constante ... ¿Cuáles son los supuestos básicos / hipótesis que hacemos cuando usamos bosque aleatorio? ¿Cuáles son las...

42
¿Por qué disminuir la muestra?

Supongamos que quiero aprender un clasificador que predice si un correo electrónico es spam. Y supongamos que solo el 1% de los correos electrónicos son spam. Lo más fácil sería aprender el clasificador trivial que dice que ninguno de los correos electrónicos son spam. Este clasificador nos daría...

41
¿Cómo interpretar los valores de la medida F?

Me gustaría saber cómo interpretar una diferencia de valores de medida f. Sé que la medida f es una media equilibrada entre precisión y recuperación, pero estoy preguntando sobre el significado práctico de una diferencia en las medidas F. Por ejemplo, si un clasificador C1 tiene una precisión de...

37
SVM, sobreajuste, maldición de dimensionalidad

Mi conjunto de datos es pequeño (120 muestras), sin embargo, el número de características es grande varía de (1000-200,000). Aunque estoy haciendo una selección de características para elegir un subconjunto de características, aún podría sobreajustar. Mi primera pregunta es, ¿cómo maneja SVM el...

34
¿Por qué hay una diferencia entre calcular manualmente un intervalo de confianza del 95% de regresión logística y usar la función confint () en R?

Queridos todos, he notado algo extraño que no puedo explicar, ¿verdad? En resumen: el enfoque manual para calcular un intervalo de confianza en un modelo de regresión logística y la función R confint()dan resultados diferentes. He estado pasando por la regresión logística aplicada de Hosmer &...