Estoy ejecutando una clasificación de árbol de decisión usando SPSS en un conjunto de datos con alrededor de 20 predictores (categórico con pocas categorías). CHAID (detección de interacción automática de chi-cuadrado) y CRT / CART (árboles de clasificación y regresión) me están dando diferentes árboles. ¿Alguien puede explicar los méritos relativos de CHAID vs CRT? ¿Cuáles son las implicaciones de usar un método sobre el otro?
23
Todos los métodos de un solo árbol implican una asombrosa cantidad de comparaciones múltiples que aportan una gran inestabilidad al resultado. Es por eso que para lograr una discriminación predictiva satisfactoria es necesaria alguna forma de promediación de árboles (embolsado, aumento, bosques aleatorios) (excepto que se pierde la ventaja de los árboles: la interpretabilidad). La simplicidad de los árboles individuales es en gran medida una ilusión. Son simples porque están equivocados en el sentido de que entrenar el árbol en múltiples subconjuntos grandes de datos revelará un gran desacuerdo entre las estructuras de los árboles.
No he visto ninguna metodología CHAID reciente, pero CHAID en su encarnación original fue un gran ejercicio para la sobreinterpretación de datos.
fuente