Estoy tratando de convertir mi columna de factor a variables ficticias:
str(cards$pointsBin)
# Factor w/ 5 levels ".lte100",".lte150",..: 3 2 3 1 4 4 2 2 4 4 ...
labels <- model.matrix(~ pointsBin, data=cards)
head(labels)
# (Intercept) pointsBin.lte150 pointsBin.lte200 pointsBin.lte250 pointsBin.lte300
# 741 1 0 0 0 0
# 407 1 1 0 0 0
# 676 1 0 0 1 0
# 697 1 1 0 0 0
# 422 1 0 1 0 0
# 300 1 0 1 0 0
No hay una columna para el primer valor de mi factor ( ".lte100"
), que es lo que la primera fila se debe clasificar como ¿Cómo recupero estos datos? ¿Y qué significa la columna Interceptar que parece ser todo 1?
r
categorical-data
categorical-encoding
digitgopher
fuente
fuente
- 1
cuando tienes un solo predictor categórico representado como un factor (como en esta pregunta), asumirá que realmente no quieres decir eso y cambiarás a usar sum- codificación a cero; que por supuesto es solo una parametrización diferente. Demasiado amable, si me preguntas.Respuestas:
Considera lo siguiente:
Los dos primeros comandos son idénticos. Los dos últimos comandos especifican no producir la intercepción y mantienen las dos variables ficticias producidas.
fuente