Tengo los datos con variables categóricas y variables continuas, pero es la necesidad de encontrar valor de información en el análisis explicativo de datos.
Solo dé la razón por la cual estamos calculando el valor de la información para cada variable al comienzo del análisis de datos y cuál será el punto de corte del VALOR DE INFORMACIÓN para tomar en cuenta el análisis
data-visualization
user43247
fuente
fuente
Respuestas:
En términos generales, el valor de información proporciona una medida de qué tan bien una variableX es capaz de distinguir entre una respuesta binaria (por ejemplo, "buena" versus "mala") en alguna variable objetivo Y . La idea es si una variableX tiene un valor de información bajo, puede que no haga un trabajo suficiente para clasificar la variable objetivo y, por lo tanto, se elimina como una variable explicativa.
Para ver cómo funciona esto, dejemosX estar agrupado en norte contenedores Cadax ∈ X corresponde a un y∈ Y que puede tomar uno de dos valores, digamos 0 o 1. Luego, para contenedores Xyo , 1 ≤ i ≤ n ,
dónde
En el contexto de la calificación crediticia, estos dos recursos deberían ayudar:
[1] http://www.mwsug.org/proceedings/2013/AA/MWSUG-2013-AA14.pdf
[2] http://support.sas.com/resources/papers/proceedings12/141-2012.pdf
fuente