En términos generales, el valor de información proporciona una medida de qué tan bien una variable X es capaz de distinguir entre una respuesta binaria (por ejemplo, "buena" versus "mala") en alguna variable objetivo Y. La idea es si una variableX tiene un valor de información bajo, puede que no haga un trabajo suficiente para clasificar la variable objetivo y, por lo tanto, se elimina como una variable explicativa.
Para ver cómo funciona esto, dejemos X estar agrupado en nortecontenedores Cadax ∈ X corresponde a un y∈ Y que puede tomar uno de dos valores, digamos 0 o 1. Luego, para contenedores Xyo, 1 ≤ i ≤ n,
yoV=∑i = 1norte(solyo-siyo) ∗ ln(solyo/ /siyo)
dónde
siyo= ( # de 0 0'pecado Xyo) / ( # de 0 0'pecado X) = la proporción de 0 0está en la papelera yo versus todos los contenedores
solyo= ( # de 1'pecado Xyo) / ( # de 1'pecado X) = la proporción de 1está en la papelera yo versus todos los contenedores
En(solyo/ /siyo) también se conoce como el peso de la evidencia (para bin Xyo) Los valores de corte pueden variar y la selección es subjetiva. A menudo usoyoV< 0.3 (como lo hace [1] a continuación).
En el contexto de la calificación crediticia, estos dos recursos deberían ayudar:
[1] http://www.mwsug.org/proceedings/2013/AA/MWSUG-2013-AA14.pdf
[2] http://support.sas.com/resources/papers/proceedings12/141-2012.pdf