Preguntas etiquetadas con python

13
Paquete GBM vs. Caret usando GBM

He estado usando el ajuste del modelo caret, pero luego volví a ejecutar el modelo usando el gbmpaquete. Entiendo que el caretpaquete usa gbmy el resultado debe ser el mismo. Sin embargo, solo una ejecución de prueba rápida usando data(iris)muestra una discrepancia en el modelo de aproximadamente...

13
Usando BIC para estimar el número de k en KMEANS

Actualmente estoy tratando de calcular el BIC para mi conjunto de datos de juguete (ofc iris (:). Quiero reproducir los resultados como se muestra aquí (Fig. 5). Ese documento también es mi fuente para las fórmulas de BIC. Tengo 2 problemas con esto: Notación: ninin_i = número de elementos en...

13
Usando iloc para establecer valores [cerrado]

Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado hace 2 años . Esta línea devuelve las primeras 4 filas en el...

12
¿Es posible evaluar GLM en Python / scikit-learn usando las distribuciones de Poisson, Gamma o Tweedie como la familia para la distribución de errores?

Intento aprender algo de Python y Sklearn, pero para mi trabajo necesito ejecutar regresiones que utilicen distribuciones de error de las familias Poisson, Gamma y especialmente Tweedie. No veo nada en la documentación sobre ellos, pero están en varias partes de la distribución R, por lo que me...

12
¿Cómo realizar la imputación de valores en una gran cantidad de puntos de datos?

Tengo un conjunto de datos muy grande y faltan alrededor del 5% de valores aleatorios. Estas variables están correlacionadas entre sí. El siguiente conjunto de datos R de ejemplo es solo un ejemplo de juguete con datos correlacionados ficticios. set.seed(123) # matrix of X variable xmat <-...

12
Interpretación de salida de scikit predic_proba

Estoy trabajando con la biblioteca scikit-learn en python. En el siguiente código, estoy prediciendo la probabilidad, pero no sé cómo leer la salida. Datos de prueba from sklearn.ensemble import RandomForestClassifier as RF from sklearn import cross_validation X =

12
¿Cómo usar un filtro Kalman?

Tengo una trayectoria de un objeto en un espacio 2D (una superficie). La trayectoria se da como una secuencia de (x,y)coordenadas. Sé que mis medidas son ruidosas y, a veces, tengo valores atípicos evidentes. Entonces, quiero filtrar mis observaciones. Hasta donde entendí el filtro de Kalman, hace...

12
¿Cómo realizar PCA para datos de muy alta dimensionalidad?

Para realizar el análisis de componentes principales (PCA), debe restar las medias de cada columna de los datos, calcular la matriz de coeficientes de correlación y luego encontrar los vectores propios y los valores propios. Bueno, más bien, esto es lo que hice para implementarlo en Python, excepto...