Estoy tratando de ejecutar xgboost en scikit learn. Y solo uso Pandas para cargar datos en el marco de datos. ¿Cómo se supone que debo usar pandas df con xgboost? Estoy confundido por la rutina DMatrix requerida para ejecutar xgboost algo.
scikit-learn
pandas
xgboost
Fantasma en la concha
fuente
fuente
xgb.DMatrix(X_train.values, y_train.values)
, estoy viendoTypeError: can not initialize DMatrix from dict
.values
)Hay algunas buenas noticias, hay una biblioteca
pandas_ml
que admite XGBoost, probablemente esto simplificará el flujo de trabajo simplemente.http://pandas-ml.readthedocs.io/en/latest/xgboost.html
fuente
Ahora puede usar Pandas DataFrames directamente con XGBoost. Definitivamente funciona con xgboost 0.81.
Por ejemplo, donde X_train, X_val, y_train e y_val son DataFrames:
fuente