Preguntas etiquetadas con spss

SPSS es un paquete de software estadístico. Use esta etiqueta para cualquier pregunta sobre el tema que (a) involucre a SPSS ya sea como una parte crítica de la pregunta o la respuesta esperada y (b) no se trata solo de cómo usar SPSS.

355
Python como banco de trabajo de estadísticas

Mucha gente usa una herramienta principal como Excel u otra hoja de cálculo, SPSS, Stata o R para sus necesidades estadísticas. Pueden recurrir a algún paquete específico para necesidades muy especiales, pero se pueden hacer muchas cosas con una simple hoja de cálculo o un paquete de estadísticas...

78
Un ejemplo: regresión LASSO usando glmnet para el resultado binario

Estoy empezando a incursionar con el uso de glmnetla LASSO regresión donde mi resultado de interés es dicotómica. He creado un pequeño marco de datos simulados a continuación: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84,...

77
¿Cuándo es R al cuadrado negativo?

Entiendo que no puede ser negativo ya que es el cuadrado de R. Sin embargo, ejecuté una regresión lineal simple en SPSS con una sola variable independiente y una variable dependiente. Mi salida SPSS me da un valor negativo para . Si tuviera que calcular esto a mano desde R, entonces sería positivo....

46
Interpretación del logaritmo transformador predictor y / o respuesta

Me pregunto si hace una diferencia en la interpretación si solo el dependiente, tanto el dependiente como el independiente, o solo las variables independientes se transforman logarítmicamente. Considere el caso de log(DV) = Intercept + B1*IV + Error Puedo interpretar el IV como el porcentaje...

34
¿Por qué hay una diferencia entre calcular manualmente un intervalo de confianza del 95% de regresión logística y usar la función confint () en R?

Queridos todos, he notado algo extraño que no puedo explicar, ¿verdad? En resumen: el enfoque manual para calcular un intervalo de confianza en un modelo de regresión logística y la función R confint()dan resultados diferentes. He estado pasando por la regresión logística aplicada de Hosmer &...

29
Cómo lidiar con datos jerárquicos / anidados en el aprendizaje automático

Explicaré mi problema con un ejemplo. Suponga que desea predecir el ingreso de un individuo dados algunos atributos: {Edad, Sexo, País, Región, Ciudad}. Tienes un conjunto de datos de entrenamiento como este train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2,...

28
Calcular la repetibilidad de los efectos de un modelo más antiguo

Acabo de encontrar este artículo , que describe cómo calcular la repetibilidad (también conocida como confiabilidad, también conocida como correlación intraclase) de una medición a través del modelado de efectos mixtos. El código R sería: #fit the model fit =

23
CHAID vs CRT (o CART)

Estoy ejecutando una clasificación de árbol de decisión usando SPSS en un conjunto de datos con alrededor de 20 predictores (categórico con pocas categorías). CHAID (detección de interacción automática de chi-cuadrado) y CRT / CART (árboles de clasificación y regresión) me están dando diferentes...

22
¿Cómo agrupar series de tiempo?

Tengo una pregunta sobre el análisis de conglomerados. Hay 3000 empresas, que deben agruparse de acuerdo con su consumo de energía durante 5 años. Cada empresa tiene valores por cada hora durante 5 años. Me gustaría saber si algunas empresas tienen el mismo patrón en el poder de uso durante el...

20
¿Cuáles son los valores correctos para precisión y recuperación en casos extremos?

La precisión se define como: p = true positives / (true positives + false positives) ¿Es cierto que, como true positivesy false positivesenfoque 0, la precisión se aproxima a 1? La misma pregunta para recordar: r = true positives / (true positives + false negatives) Actualmente estoy...

19
Visualizando respuestas Likert usando R o SPSS

Tengo 82 encuestados en 2 grupos (43 en el Grupo A y 39 en el Grupo B) que completaron una encuesta de 65 preguntas Likert, cada una con un rango de 1 a 5 (totalmente de acuerdo - totalmente en desacuerdo). Por lo tanto, tengo un marco de datos con 66 columnas (1 para cada pregunta + 1 que indica...