Esta es la puntuación F beta:
El artículo de Wikipedia dice que . "measures the effectiveness of retrieval with respect to a user who attaches β times as much importance to recall as precision"
No entendí la idea. ¿Por qué definir así? ¿Puedo definir esta manera:
¿Y cómo mostrar β times as much importance
?
Respuestas:
Dejando que sea el peso en la primera definición que proporcione y el peso en la segunda, las dos definiciones son equivalentes cuando establece , por lo que estas dos definiciones representan solo diferencias notacionales en La definición de la puntuación . Lo he visto definido tanto en la primera forma (por ejemplo, en la página de Wikipedia ) como en la segunda (por ejemplo, aquí ).˜ β ˜ β = β 2 F ββ β~ β~=β2 Fβ
La medida se obtiene tomando la media armónica de precisión y recuperación, es decir, el recíproco del promedio del recíproco de precisión y el recíproco de recuperación:F1
En lugar de usar pesos en el denominador que son iguales y suman 1 ( para recordar y para precisión), podríamos asignar pesos que aún suman 1 pero cuyo peso en la recuperación es veces mayor que el peso en la precisión ( para la recuperación y para la precisión). Esto produce su segunda definición de la puntuación : 112 ββ12 β 1ββ+1 Fβ1β+1 Fβ
Nuevamente, si hubiéramos usado lugar de aquí, habríamos llegado a su primera definición, por lo que las diferencias entre las dos definiciones son simplemente notacionales. ββ2 β
fuente
La razón para definir el puntaje F-beta con es exactamente la cita que proporciona (es decir, querer adjuntar veces más importante para recordar que precisión) dada una definición particular de lo que significa adjuntar veces más importante para recordar que la precisión.β2 β β
La forma particular de definir la importancia relativa de las dos métricas que conduce a la formulación se puede encontrar en Recuperación de información (Van Rijsbergen, 1979):β2
La motivación para este ser:
Para ver que esto conduce a la de formulación que pueden comenzar con la fórmula general para la media armónica ponderada de y y calcular sus derivadas parciales con respecto a y . La fuente citó usos (para "medir la eficacia"), que está a sólo y la explicación es equivalente si consideramos o .β2 P R P R E 1−F E F
Ahora, el establecimiento de los derivados iguales entre sí impone una restricción sobre la relación entre y la relación . Dado que deseamos asignar veces tanta importancia para recordar como precisión, consideraremos la relación 1 :α P/R β R/P
Definir como esta relación y reorganizar para da las ponderaciones en términos de :β α β2
Obtenemos:
Que se puede reorganizar para dar el formulario en su pregunta.
Por lo tanto, dada la definición citada, si desea asignar veces tanta importancia para recordar como precisión, entonces debe usarse la formulación . Esta interpretación no se cumple si uno usa . La interpretación equivalente, menos intuitiva, en el caso de que solo usemos , sería que queremos adjuntar veces más importante para recordar que precisión.β β2 β β β−−√
Puede definir una puntuación como sugiere, sin embargo, debe tener en cuenta que, en este caso, la interpretación discutida ya no es válida o está implicando alguna otra definición para cuantificar el equilibrio entre precisión y recuperación.
Notas al pie:
Referencias
fuente
Señalar algo rápidamente.
De hecho, creo que es lo contrario: dado que mayor es mejor en la puntuación F-β, desea que el denominador sea pequeño. Por lo tanto, si disminuye β, el modelo se castiga menos por tener una buena puntuación de precisión. Si aumenta β, entonces el puntaje F-β se castiga más cuando la precisión es alta.
Si desea ponderar la puntuación F-β para que valore la precisión, β debe ser 0 <β <1, donde β-> 0 solo valora la precisión (el numerador se vuelve muy pequeño y lo único en el denominador es recordar, entonces la puntuación F-β disminuye a medida que aumenta el recuerdo).
http://scikit-learn.org/stable/modules/generated/sklearn.metrics.fbeta_score.html
fuente
La razón por la que β ^ 2 se multiplica con precisión es la forma en que se definen los F-Scores. Significa que a medida que aumenta el valor beta, valoras más la precisión. Si quisieras multiplicarlo con un retiro que también funcionaría, solo significaría que a medida que el valor beta aumenta, tu valor recuerda más.
fuente
El valor beta mayor que 1 significa que queremos que nuestro modelo preste más atención al retiro del modelo en comparación con la precisión. Por otro lado, un valor de menos de 1 pone más énfasis en la precisión.
fuente