No entiendo exactamente qué se entiende por tamaño de nodo. Sé qué es un nodo de decisión, pero no qué tamaño de nodo es.
fuente
No entiendo exactamente qué se entiende por tamaño de nodo. Sé qué es un nodo de decisión, pero no qué tamaño de nodo es.
Un árbol de decisión funciona por partición recursiva del conjunto de entrenamiento. Cada nodo de un árbol de decisión está asociado con un conjunto de puntos de datos del conjunto de entrenamiento:
Puede encontrar el parámetro nodesize
en algunos paquetes de bosques aleatorios, por ejemplo, R : este es el tamaño mínimo del nodo , en el ejemplo anterior, el tamaño mínimo del nodo es 10. Este parámetro establece implícitamente la profundidad de sus árboles.
nodesize
del paquete de bosque aleatorio R
Tamaño mínimo de nodos terminales. Establecer este número más grande hace que se cultiven árboles más pequeños (y por lo tanto toma menos tiempo). Tenga en cuenta que los valores predeterminados son diferentes para la clasificación (1) y la regresión (5).
En otros paquetes encontrará directamente el parámetro depth
, por ejemplo, WEKA :
-depth
del paquete forestal aleatorio WEKA
La profundidad máxima de los árboles, 0 para ilimitado. (predeterminado 0)
No está claro si el tamaño de nodo está en el muestreo "en bolsa" o en el error "fuera de bolsa". Si está en el muestreo "fuera de bolsa", es un poco más restrictivo.
fuente