¿Cuáles son los supuestos habituales para la regresión lineal? ¿Incluyen: Una relación lineal entre la variable independiente y la dependiente errores independientes distribución normal de errores homocedasticidad ¿Hay
Se refiere a las condiciones bajo las cuales un procedimiento estadístico produce estimaciones y / o inferencias válidas. Por ejemplo, muchas técnicas estadísticas requieren la suposición de que los datos se muestrean al azar de alguna manera. Los resultados teóricos sobre los estimadores generalmente requieren suposiciones sobre el mecanismo de generación de datos.
¿Cuáles son los supuestos habituales para la regresión lineal? ¿Incluyen: Una relación lineal entre la variable independiente y la dependiente errores independientes distribución normal de errores homocedasticidad ¿Hay
Actualmente estoy trabajando en un trabajo de investigación cuasi-experimental. Solo tengo un tamaño de muestra de 15 debido a la baja población dentro del área elegida y que solo 15 se ajustan a mis criterios. ¿Es 15 el tamaño mínimo de muestra para calcular la prueba t y la prueba F? Si es así,...
Para un estudio de simulación tengo para generar variables aleatorias que muestran un (población) de correlación prefined a una variable existente .YYY Miré en los Rpaquetes copulay CDVineque pueden producir distribuciones aleatorias multivariadas con una estructura de dependencia dada. Sin...
La página de Wikipedia en ANOVA enumera tres supuestos , a saber: Independencia de casos: esta es una suposición del modelo que simplifica el análisis estadístico. Normalidad: las distribuciones de los residuos son normales. Igualdad (u "homogeneidad") de variaciones, llamada homocedasticidad...
Supongo que me siento frustrado cada vez que escucho a alguien decir que la no normalidad de los residuos y / o la heterocedasticidad viola los supuestos de OLS. Para estimar los parámetros en un modelo OLS, ninguno de estos supuestos es necesario según el teorema de Gauss-Markov. Veo cómo esto...
Hay varios hilos en este sitio que discuten cómo determinar si los residuos de OLS se distribuyen asintóticamente normalmente. Otra forma de evaluar la normalidad de los residuos con el código R se proporciona en este excelente respuesta . Esta es otra discusión sobre la diferencia práctica entre...
Estoy aprendiendo el análisis de supervivencia de esta publicación en UCLA IDRE y me tropecé en la sección 1.2.1. El tutorial dice: ... si se supiera que los tiempos de supervivencia están distribuidos exponencialmente , entonces la probabilidad de observar un tiempo de supervivencia ... ¿Por...
Considere la siguiente figura de los Modelos lineales de Faraway con R (2005, p. 59). La primera gráfica parece indicar que los residuos y los valores ajustados no están correlacionados, ya que deberían estar en un modelo lineal homoscedástico con errores distribuidos normalmente. Por lo tanto,...
Estoy trabajando con un gran conjunto de datos (confidencial, por lo que no puedo compartir demasiado), y llegué a la conclusión de que sería necesaria una regresión binomial negativa. Nunca antes había hecho una regresión glm, y no puedo encontrar ninguna información clara sobre cuáles son los...
Mi pregunta surge de este comentario en una publicación de blog de Andrew Gelman en la que aboga por el uso de intervalos de confianza del 50% en lugar de intervalos de confianza del 95%, aunque no sobre la base de que se estimen de manera más sólida: Prefiero intervalos de 50% a 95% por 3...
Estoy tratando de entender lo que significa la suposición de observaciones independientes . Algunas definiciones son: "Dos eventos son independientes si y solo si P(a∩b)=P(a)∗P(b)PAGS(una∩si)=PAGS(una)∗PAGS(si)P(a \cap b) = P(a) * P(b) ". ( Diccionario de términos estadísticos ) "La ocurrencia...
Como ejemplo, considere el ChickWeightconjunto de datos en R. La varianza obviamente crece con el tiempo, así que si uso una regresión lineal simple como: m <- lm(weight ~ Time*Diet, data=ChickWeight) Mis preguntas: ¿Qué aspectos del modelo serán cuestionables? ¿Se limitan los problemas a...
Al ajustar un modelo de regresión, qué sucede si no se cumplen los supuestos de los resultados, específicamente: ¿Qué sucede si los residuos no son homoscedásticos? Si los residuos muestran un patrón creciente o decreciente en la gráfica Residual vs. ¿Qué sucede si los residuos no se distribuyen...
Aprendí que debo comprobar la normalidad no en los datos en bruto sino en sus residuos. ¿Debo calcular los residuos y luego hacer la prueba W de Shapiro-Wilk? ¿Los residuos se calculan como: ?Xi−meanXi−meanX_i - \text{mean} Consulte esta pregunta anterior para mis datos y el...
La prueba de Mantel generalmente se aplica a matrices simétricas de distancia / diferencia. Según tengo entendido, una suposición de la prueba es que la medida utilizada para definir las diferencias debe ser al menos semimétrica (cumplir con los requisitos estándar de una métrica pero no la...
Quiero hacer un modelo logístico a partir de los datos de mi encuesta. Es una pequeña encuesta de cuatro colonias residenciales en la que solo se entrevistó a 154 encuestados. Mi variable dependiente es "transición satisfactoria al trabajo". Descubrí que, de los 154 encuestados, 73 dijeron que...
Ejecuté un diseño repetido mediante el cual probé 30 hombres y 30 mujeres en tres tareas diferentes. Quiero entender cómo el comportamiento de hombres y mujeres es diferente y cómo eso depende de la tarea. Utilicé tanto el paquete lmer como el lme4 para investigar esto, sin embargo, estoy atascado...
He leído que la prueba t es "razonablemente robusta" cuando las distribuciones de las muestras se apartan de la normalidad. Por supuesto, lo importante es la distribución muestral de las diferencias. Tengo datos para dos grupos. Uno de los grupos está muy sesgado en la variable dependiente. El...
Estoy un poco confundido sobre cuáles son los supuestos de la regresión lineal. Hasta ahora verifiqué si: Todas las variables explicativas se correlacionaron linealmente con la variable de respuesta. (Este fue el caso) hubo alguna colinealidad entre las variables explicativas. (había poca...
Considere el modelo estándar para regresión múltiple donde , por lo que la normalidad, la homocedasticidad y la falta de correlación de errores se mantienen.ε ∼ N ( 0 , σ 2 I n )Y= Xβ+ εY=Xβ+εY=X\beta+\varepsilonε ∼ N( 0 , σ2yonorte)ε∼N(0,σ2In)\varepsilon \sim \mathcal N(0, \sigma^2I_n) Supongamos...