Sé la fórmula del error cuadrático medio y cómo calcularlo. Cuando hablamos de una regresión podemos calcular el error cuadrático medio. Sin embargo, ¿podemos hablar sobre un MSE para un problema de clasificación y cómo
Sé la fórmula del error cuadrático medio y cómo calcularlo. Cuando hablamos de una regresión podemos calcular el error cuadrático medio. Sin embargo, ¿podemos hablar sobre un MSE para un problema de clasificación y cómo
Mis predicciones provenientes de un modelo de regresión logística (glm en R) no están delimitadas entre 0 y 1 como esperaba. Comprendo la regresión logística es que los parámetros de entrada y modelo se combinan linealmente y la respuesta se transforma en una probabilidad utilizando la función de...
Al obtener muestras de MCMC para hacer inferencia sobre un parámetro en particular, ¿cuáles son buenas guías para la cantidad mínima de muestras efectivas a las que se debe apuntar? Y, ¿cambia este consejo a medida que el modelo se vuelve más o menos
Si construyo una matriz 2D compuesta completamente de datos aleatorios, esperaría que los componentes PCA y SVD esencialmente no explicaran nada. En cambio, parece que la primera columna SVD parece explicar el 75% de los datos. ¿Cómo puede ser esto posible? ¿Qué estoy haciendo mal? Aquí está la...
Si estuviera interesado en ajuste de dos vías interacciones entre una variable lineal explicativo y otra variable explicativa b que tiene una relación cuadrática con la variable dependiente y , tendría que incluir tanto la interacción con el componente cuadrática y la interacción con el lineal...
Aquí está mi contexto para esta pregunta: por lo que puedo decir, no podemos ejecutar una regresión de mínimos cuadrados ordinarios en R cuando usamos datos ponderados y el surveypaquete. Aquí, tenemos que usar svyglm(), que en su lugar ejecuta un modelo lineal generalizado (¿qué puede ser lo...
En el siguiente ejemplo > m = matrix(c(3, 6, 5, 6), nrow=2) > m [,1] [,2] [1,] 3 5 [2,] 6 6 > (OR = (3/6)/(5/6)) #1 [1] 0.6 > fisher.test(m) #2 Fisher's Exact Test for Count Data data: m p-value = 0.6699 alternative hypothesis: true odds ratio is not equal to 1 95 percent...
Soy nuevo en ciencia de datos y tengo problemas para encontrar clústeres en un conjunto de datos con 200,000 filas y 50 columnas en R. Dado que los datos tienen variables tanto numéricas como nominales, los métodos como K-means que usa la medida de distancia euclidiana no parecen ser una opción...
Ejecuté PCA en 25 variables y seleccioné las 7 mejores PC usando prcomp. prc <- prcomp(pollutions, center=T, scale=T, retx=T) Luego hice rotación varimax en esos componentes. varimax7 <- varimax(prc$rotation[,1:7]) Y ahora deseo varimax rotar los datos rotados por PCA (ya que no es parte...
Editar He encontrado un documento que describe exactamente el procedimiento que necesito. La única diferencia es que el documento interpola datos medios mensuales a diarios, al tiempo que conserva los medios mensuales. Tengo problemas para implementar el enfoque R. Cualquier pista es...
Estoy usando el paquete R lavaan para estimar un modelo de ecuación estructural. Digamos que el modelo consta de 1 variable manifiesta endógena con 1 latente y 2 variables explicativas manifiestas: group = {0,1} attitude1 = latent,scale age = respondent's age El modelo de lavaan deseado es...
Me gustaría comparar modelos seleccionados con cresta, lazo y red elástica. La figura a continuación muestra las rutas de los coeficientes utilizando los 3 métodos: cresta (Fig. A, alfa = 0), lazo (Fig. B; alfa = 1) y red elástica (Fig. C; alfa = 0.5). La solución óptima depende del valor...
Tengo un conjunto de valores xxx e que están teóricamente relacionados exponencialmente:yyy y=axby=axsiy = ax^b Una forma de obtener los coeficientes es aplicando logaritmos naturales en ambos lados y ajustando un modelo lineal: > fit <- lm(log(y)~log(x)) > a <-
Para datos distribuidos aproximadamente normalmente, los diagramas de caja son una excelente manera de visualizar rápidamente la mediana y la difusión de los datos, así como la presencia de valores atípicos. Sin embargo, para las distribuciones de colas más pesadas, muchos puntos se muestran como...
Tengo resultados de la misma prueba aplicada a dos muestras independientes: x <- c(17, 12, 13, 16, 9, 19, 21, 12, 18, 17) y <- c(10, 6, 15, 9, 8, 11, 8, 16, 13, 7, 5, 14) Y quiero calcular una prueba de suma de rango de Wilcoxon. Cuando calculo la estadística a mano, obtengo: TWTWT_{W}TW=...
¿Existe alguna literatura que examine la elección del tamaño del minibatch al realizar el descenso de gradiente estocástico? En mi experiencia, parece ser una opción empírica, que generalmente se encuentra a través de la validación cruzada o el uso de diferentes reglas generales. ¿Es una buena...
Necesito estimar la función de riesgo basal en un modelo de Cox dependiente del tiempoλ0(t)λ0(t)\lambda_0(t) λ(t)=λ0(t)exp(Z(t)′β)λ(t)=λ0(t)exp(Z(t)′β)\lambda(t) = \lambda_0(t) \exp(Z(t)'\beta) Mientras tomé el curso de supervivencia, recuerdo que la derivada directa de la función de riesgo...
Realicé un glm.nb por glm1<-glm.nb(x~factor(group)) siendo el grupo una categoría y x una variable métrica. Cuando intento obtener el resumen de los resultados, obtengo resultados ligeramente diferentes, dependiendo de si uso summary()o summary.glm. summary(glm1)me da ... Coefficients:...
¿Es posible realizar un análisis de potencia para la prueba U de Kruskal-Wallis y Mann-Whitney? En caso afirmativo, ¿hay algún paquete / función de R que lo
He leído algunas explicaciones sobre las propiedades de los modelos lineales frente a los no lineales, pero aún así a veces no estoy seguro de si un modelo disponible es lineal o no lineal. Por ejemplo, ¿el siguiente modelo es lineal o no lineal? yt=β0+β1B(L;θ)Xt+εtyt=β0+β1B(L;θ)Xt+εty_t=\beta_0 +...