He realizado la clasificación usando múltiples clasificadores para datos etiquetados de 2 clases, y utilicé la validación cruzada 5 veces. Para cada pliegue calculé tp, tn, fp y fn. Luego calculé la precisión, precisión, recuperación y puntaje F para cada prueba. Mi pregunta es, cuando quiero promediar los resultados, tomé el promedio de precisiones, pero ¿puedo promediar la precisión, el recuerdo y el puntaje F también? ¿O esto sería matemáticamente incorrecto? PD Los conjuntos de datos utilizados en cada pliegue están bien equilibrados en términos del número de instancias por clase.
Gracias.
Respuestas:
La puntuación , suponiendo que esté utilizando la definición habitual, ya es una combinación de precisión y recuperación. Específicamente, es la media armónica de ellos. En otras palabras, está destinado a capturar la 'efectividad' de un sistema donde el el usuario coloca pesos iguales en precisión y recuperación. Hay una extensión, llamada puntaje , que le da a más peso para recordar que la precisión. Activado Por otro lado, si está preguntando si puede promediar los 5F
Solo tenga en cuenta que existen algunos problemas con el uso de estos valores para hacer inferencias sobre el error de generalización de los clasificadores. Por ejemplo, una prueba entre las puntuaciones para un clasificador y las puntuaciones para otro clasificador será demasiado optimista.t F F
fuente