Profundidad de un árbol de decisión

14

Dado que el algoritmo del árbol de decisión se divide en un atributo en cada paso, la profundidad máxima de un árbol de decisión es igual al número de atributos de los datos. ¿Es esto correcto?

Qwerto
fuente

Respuestas:

27

No, porque los datos se pueden dividir en el mismo atributo varias veces. Y esta característica de los árboles de decisión es importante porque les permite capturar no linealidades en atributos individuales.

Editar: en apoyo del punto anterior, aquí está el primer árbol de regresión que creé. Tenga en cuenta que la acidez volátil y el alcohol aparecen varias veces:

ingrese la descripción de la imagen aquí

mkt - Restablecer a Monica
fuente
44
No entiendo por qué te votaron negativamente, pero lo equilibré nuevamente (+1);)
Firebug
1
Soy un gran creyente, que los votos negativos a veces ocurren al azar por casualidad, independientemente de la calidad de una publicación. Solo tenemos que acostumbrarnos y no perder el tiempo pensando demasiado en los votos negativos singulares.
Bernhard
55
@mkt si tiene ganas de volver a editar, puede agregar que, por lo general, un árbol de decisión deja de crear nuevas ramas cuando se alcanza un nivel de pureza especificado previamente, un nodo tiene menos de un número específico de elementos, o una división de un nodo conduciría a un nuevo nodo con menos de un número especificado de elementos. Estas razones pueden llevar fácilmente a que un atributo no se use en absoluto.
meh
1
+1, pero esta trama deja algo que desear. ¿Qué rama representa yes, por ejemplo? Podría ser útil publicar el conjunto de datos y el código, si eso es factible.
gung - Restablece a Monica
44
Lo que quiero decir es, supongamos alcohol = 10.50(es decir, alcohol < 10.53), ¿continúas por la rama derecha o izquierda del árbol?
gung - Restablece a Monica