Preguntas etiquetadas con r

13

¿Se puede usar el error cuadrático medio para la clasificación?

Sé la fórmula del error cuadrático medio y cómo calcularlo. Cuando hablamos de una regresión podemos calcular el error cuadrático medio. Sin embargo, ¿podemos hablar sobre un MSE para un problema de clasificación y cómo

classification error

13

Comprender las predicciones de la regresión logística.

Mis predicciones provenientes de un modelo de regresión logística (glm en R) no están delimitadas entre 0 y 1 como esperaba. Comprendo la regresión logística es que los parámetros de entrada y modelo se combinan linealmente y la respuesta se transforma en una probabilidad utilizando la función de...

r regression logistic generalized-linear-model

13

Tamaño de muestra efectivo para la inferencia posterior del muestreo de MCMC

Al obtener muestras de MCMC para hacer inferencia sobre un parámetro en particular, ¿cuáles son buenas guías para la cantidad mínima de muestras efectivas a las que se debe apuntar? Y, ¿cambia este consejo a medida que el modelo se vuelve más o menos

bayesian sample-size mcmc posterior

13

Para una matriz aleatoria, ¿no debería una SVD explicar nada? ¿Qué estoy haciendo mal?

Si construyo una matriz 2D compuesta completamente de datos aleatorios, esperaría que los componentes PCA y SVD esencialmente no explicaran nada. En cambio, parece que la primera columna SVD parece explicar el 75% de los datos. ¿Cómo puede ser esto posible? ¿Qué estoy haciendo mal? Aquí está la...

r pca svd

13

Términos de interacción y polinomios de orden superior

Si estuviera interesado en ajuste de dos vías interacciones entre una variable lineal explicativo y otra variable explicativa b que tiene una relación cuadrática con la variable dependiente y , tendría que incluir tanto la interacción con el componente cuadrática y la interacción con el lineal...

r regression model-selection

13

R-cuadrado en el modelo lineal versus desviación en el modelo lineal generalizado?

Aquí está mi contexto para esta pregunta: por lo que puedo decir, no podemos ejecutar una regresión de mínimos cuadrados ordinarios en R cuando usamos datos ponderados y el surveypaquete. Aquí, tenemos que usar svyglm(), que en su lugar ejecuta un modelo lineal generalizado (¿qué puede ser lo...

r generalized-linear-model least-squares r-squared deviance

13

¿Por qué difieren los odds ratios de la fórmula y la prueba de pescador de R.? ¿Cuál debería uno elegir?

En el siguiente ejemplo > m = matrix(c(3, 6, 5, 6), nrow=2) > m [,1] [,2] [1,] 3 5 [2,] 6 6 > (OR = (3/6)/(5/6)) #1 [1] 0.6 > fisher.test(m) #2 Fisher's Exact Test for Count Data data: m p-value = 0.6699 alternative hypothesis: true odds ratio is not equal to 1 95 percent...

r odds-ratio fishers-exact

13

Cluster Big Data en R y ¿el muestreo es relevante?

Soy nuevo en ciencia de datos y tengo problemas para encontrar clústeres en un conjunto de datos con 200,000 filas y 50 columnas en R. Dado que los datos tienen variables tanto numéricas como nominales, los métodos como K-means que usa la medida de distancia euclidiana no parecen ser una opción...

r clustering sampling large-data

13

¿Cómo calcular componentes principales rotados con varimax en R?

Ejecuté PCA en 25 variables y seleccioné las 7 mejores PC usando prcomp. prc <- prcomp(pollutions, center=T, scale=T, retx=T) Luego hice rotación varimax en esos componentes. varimax7 <- varimax(prc$rotation[,1:7]) Y ahora deseo varimax rotar los datos rotados por PCA (ya que no es parte...

r pca factor-rotation

13

Interpolación de datos de influenza que conserva la media semanal

Editar He encontrado un documento que describe exactamente el procedimiento que necesito. La única diferencia es que el documento interpola datos medios mensuales a diarios, al tiempo que conserva los medios mensuales. Tengo problemas para implementar el enfoque R. Cualquier pista es...

r time-series interpolation

13

Ecuaciones estructurales: cómo especificar efectos de interacción en el paquete R lavaan

Estoy usando el paquete R lavaan para estimar un modelo de ecuación estructural. Digamos que el modelo consta de 1 variable manifiesta endógena con 1 latente y 2 variables explicativas manifiestas: group = {0,1} attitude1 = latent,scale age = respondent's age El modelo de lavaan deseado es...

r interaction sem lavaan

13

Trayectorias de coeficientes: comparación de cresta, lazo y regresión neta elástica

Me gustaría comparar modelos seleccionados con cresta, lazo y red elástica. La figura a continuación muestra las rutas de los coeficientes utilizando los 3 métodos: cresta (Fig. A, alfa = 0), lazo (Fig. B; alfa = 1) y red elástica (Fig. C; alfa = 0.5). La solución óptima depende del valor...

r multiple-regression modeling regularization

13

Regresión lineal versus no lineal

Tengo un conjunto de valores xxx e que están teóricamente relacionados exponencialmente:yyy y=axby=axsiy = ax^b Una forma de obtener los coeficientes es aplicando logaritmos naturales en ambos lados y ajustando un modelo lineal: > fit <- lm(log(y)~log(x)) > a <-

r regression linear-model model-selection nonlinear-regression

13

Boxplot equivalente para distribuciones de cola pesada?

Para datos distribuidos aproximadamente normalmente, los diagramas de caja son una excelente manera de visualizar rápidamente la mediana y la difusión de los datos, así como la presencia de valores atípicos. Sin embargo, para las distribuciones de colas más pesadas, muchos puntos se muestran como...

r distributions data-visualization data-transformation ggplot2

13

Prueba de suma de rango de Wilcoxon en R

Tengo resultados de la misma prueba aplicada a dos muestras independientes: x <- c(17, 12, 13, 16, 9, 19, 21, 12, 18, 17) y <- c(10, 6, 15, 9, 8, 11, 8, 16, 13, 7, 5, 14) Y quiero calcular una prueba de suma de rango de Wilcoxon. Cuando calculo la estadística a mano, obtengo: TWTWT_{W}TW=...

r wilcoxon-mann-whitney wilcoxon-signed-rank

13

Elegir un tamaño de minibatch apropiado para el descenso de gradiente estocástico (SGD)

¿Existe alguna literatura que examine la elección del tamaño del minibatch al realizar el descenso de gradiente estocástico? En mi experiencia, parece ser una opción empírica, que generalmente se encuentra a través de la validación cruzada o el uso de diferentes reglas generales. ¿Es una buena...

machine-learning gradient-descent hyperparameter deep-learning

13

Cómo estimar la función de riesgo de referencia en el modelo de Cox con R

Necesito estimar la función de riesgo basal en un modelo de Cox dependiente del tiempoλ0(t)λ0(t)\lambda_0(t) λ(t)=λ0(t)exp(Z(t)′β)λ(t)=λ0(t)exp⁡(Z(t)′β)\lambda(t) = \lambda_0(t) \exp(Z(t)'\beta) Mientras tomé el curso de supervivencia, recuerdo que la derivada directa de la función de riesgo...

r survival cox-model

13

dispersión en summary.glm ()

Realicé un glm.nb por glm1<-glm.nb(x~factor(group)) siendo el grupo una categoría y x una variable métrica. Cuando intento obtener el resumen de los resultados, obtengo resultados ligeramente diferentes, dependiendo de si uso summary()o summary.glm. summary(glm1)me da ... Coefficients:...

r generalized-linear-model negative-binomial

13

Análisis de potencia para Kruskal-Wallis o prueba U de Mann-Whitney usando R?

¿Es posible realizar un análisis de potencia para la prueba U de Kruskal-Wallis y Mann-Whitney? En caso afirmativo, ¿hay algún paquete / función de R que lo

r nonparametric power-analysis kruskal-wallis

13

Distinción entre modelo lineal y no lineal.

He leído algunas explicaciones sobre las propiedades de los modelos lineales frente a los no lineales, pero aún así a veces no estoy seguro de si un modelo disponible es lineal o no lineal. Por ejemplo, ¿el siguiente modelo es lineal o no lineal? yt=β0+β1B(L;θ)Xt+εtyt=β0+β1B(L;θ)Xt+εty_t=\beta_0 +...

linear-model nonlinear-regression nonlinear