¿Alguien puede explicar prácticamente la razón detrás de la impureza de Gini frente a la ganancia de información (basada en la entropía)? ¿Qué métrica es mejor usar en diferentes escenarios al usar árboles de
Un árbol de decisiones es una herramienta de soporte de decisiones que utiliza un gráfico o modelo de decisiones similar a un árbol y sus posibles consecuencias, incluidos los resultados de eventos fortuitos, los costos de recursos y la utilidad. Es una forma de mostrar un algoritmo.
¿Alguien puede explicar prácticamente la razón detrás de la impureza de Gini frente a la ganancia de información (basada en la entropía)? ¿Qué métrica es mejor usar en diferentes escenarios al usar árboles de
Estoy haciendo algunos problemas en una aplicación de árbol de decisión / bosque aleatorio. Estoy tratando de ajustar un problema que tiene números y cadenas (como el nombre del país) como características. Ahora, la biblioteca, scikit-learn toma solo números como parámetros, pero quiero inyectar...
No tenía claros algunos conceptos: XGBoost convierte a los alumnos débiles en alumnos fuertes. ¿Cuál es la ventaja de hacer esto? ¿Combinando muchos estudiantes débiles en lugar de usar un solo árbol? Random Forest usa varias muestras del árbol para crear un árbol. ¿Cuál es la ventaja de este...
Recientemente se le preguntó a un amigo mío si los algoritmos del árbol de decisión son algoritmos lineales o no lineales en una entrevista. Traté de buscar respuestas a esta pregunta pero no pude encontrar ninguna explicación satisfactoria. ¿Alguien puede responder y explicar la solución a esta...
La siguiente función de predicción también proporciona valores -ve, por lo que no puede haber probabilidades. param <- list(max.depth = 5, eta = 0.01, objective="binary:logistic",subsample=0.9) bst <- xgboost(param, data = x_mat, label = y_mat,nround = 3000) pred_s <- predict(bst,...
Creo un corr()df a partir de un df original. El corr()DF salió 70 X 70 y es imposible de visualizar el mapa de calor ... sns.heatmap(df). Si trato de mostrar corr = df.corr(), la tabla no se ajusta a la pantalla y puedo ver todas las correlaciones. ¿Es una forma de imprimir todo dfsin importar su...
¿En qué casos es mejor usar un árbol de decisión y otros casos un KNN? ¿Por qué usar uno de ellos en ciertos casos? ¿Y el otro en diferentes casos? (Al observar su funcionalidad, no el algoritmo) ¿Alguien tiene algunas explicaciones o referencias sobre
Estoy trabajando en un problema de clasificación. Tengo un conjunto de datos que contiene el mismo número de variables categóricas y variables continuas. ¿Cómo sabré qué técnica usar? entre un árbol de decisión y una regresión logística? ¿Es correcto suponer que la regresión logística será más...
Problema 1: Estoy confundido por la descripción de LightGBM con respecto a la forma en que se expande el árbol. Ellos declaran: La mayoría de los algoritmos de aprendizaje del árbol de decisión crecen en árbol por nivel (profundidad), como en la siguiente imagen: Preguntas 1 : ¿Qué...
Tengo dos preguntas relacionadas con los árboles de decisión: Si tenemos un atributo continuo, ¿cómo elegimos el valor de división? Ejemplo: Edad = (20,29,50,40 ....) Imaginemos que tenemos una variable continua que tienen valores de R . ¿Cómo puedo escribir un algoritmo que encuentre el punto...
Para las redes neuronales tenemos el teorema de aproximación universal que establece que las redes neuronales pueden aproximarse a cualquier función continua en un subconjunto compacto de .RnRnorteR^n ¿Hay un resultado similar para los árboles impulsados por gradiente? Parece razonable ya que...
Si entreno a mi modelo con el siguiente código: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target = df[target_columns] dmatrix...
Estoy trabajando con un conjunto de datos con una gran cantidad de características categóricas (> 80%) que predicen una variable objetivo continua (es decir, Regresión). He estado leyendo bastante sobre formas de manejar características categóricas. Y aprendí que la codificación única que he...
Supongamos que tengo una función suave como F( x , y) = x2+ y2F(X,y)=X2+y2f(x, y) = x^2+y^2 . Tengo un conjunto de entrenamiento y, por supuesto, no sé f, aunque puedo evaluar f donde quiera.D ⊊ { ( ( x , y) , f( x , y) ) | ( x , y) ∈ R2}re⊊{((X,y),F(X,y))El |(X,y)∈R2}D \subsetneq \{((x, y),...
Tengo un conjunto de datos que tiene un atributo de clase binaria. Hay 623 instancias con clase +1 (cáncer positivo) y 101,671 instancias con clase -1 (cáncer negativo). He probado varios algoritmos (Naive Bayes, Random Forest, AODE, C4.5) y todos ellos tienen relaciones inaceptables de falsos...
Tengo dos tensor a:[batch_size, dim] b:[batch_size, dim]. Quiero hacer un producto interno para cada par en el lote, generando c:[batch_size, 1], dónde c[i,0]=a[i,:].T*b[i,:].
Estaba analizando el clasificador creado usando un árbol de decisión. Hay un parámetro de ajuste llamado max_depth en el árbol de decisión de scikit. ¿Es esto equivalente a podar un árbol de decisión? Si no, ¿cómo podría podar un árbol de decisión usando scikit? dt_ap =...
Tengo un conjunto de datos con 20000 muestras, cada una tiene 12 características diferentes. Cada muestra está en la categoría 0 o 1. Quiero entrenar una red neuronal y un bosque de decisión para clasificar las muestras de modo que pueda comparar los resultados y ambas técnicas. Lo primero con lo...
He leído la explicación de la convolución y la entiendo hasta cierto punto. ¿Alguien puede ayudarme a entender cómo esta operación se relaciona con la convolución en redes neuronales convolucionales? ¿Es el filtro como una función gque aplica
Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 4 años . Estoy...