Tengo un modelo ajustado (de la literatura). También tengo los datos en bruto para las variables predictivas. ¿Cuál es la ecuación que debería usar para obtener probabilidades? Básicamente, ¿cómo combino datos brutos y coeficientes para obtener
Tengo un modelo ajustado (de la literatura). También tengo los datos en bruto para las variables predictivas. ¿Cuál es la ecuación que debería usar para obtener probabilidades? Básicamente, ¿cómo combino datos brutos y coeficientes para obtener
Tengo 5 variables y estoy tratando de predecir mi variable objetivo que debe estar dentro del rango de 0 a 70. ¿Cómo uso esta información para modelar mejor mi
Estamos trabajando con algunas regresiones logísticas y nos hemos dado cuenta de que la probabilidad estimada promedio siempre es igual a la proporción de unos en la muestra; es decir, el promedio de los valores ajustados es igual al promedio de la muestra. ¿Alguien puede explicarme la razón o...
Actualización : Perdón por otra actualización, pero he encontrado algunas posibles soluciones con polinomios fraccionales y el paquete de riesgos de la competencia con el que necesito ayuda. El problema No puedo encontrar una manera fácil de hacer un análisis de coeficiente dependiente del...
Supongamos que una regresión lineal simple , los residuos y dibujamos un histograma de distribución de residuos. Si obtenemos algo que parece una distribución familiar, ¿podemos suponer que nuestro término de error tiene esta distribución? Digamos, si descubrimos que los residuos se asemejan a la...
Me pregunto por qué usamos la suposición gaussiana al modelar el error. En el curso de ML de Stanford , el Prof. Ng lo describe básicamente de dos maneras: Es matemáticamente conveniente. (Está relacionado con el ajuste de mínimos cuadrados y es fácil de resolver con pseudoinverso) Debido al...
Estoy realizando un experimento que tiene lo siguiente: DV: consumo de sector (continuo o podría ser categórico) IV: Mensaje saludable, mensaje insalubre, sin mensaje (control) (3 grupos en los que las personas se asignan aleatoriamente - categórica) Este es un mensaje manipulado sobre la...
Esta es una pregunta básica sobre los modelos MA de Box-Jenkins. Según entiendo, un modelo MA es básicamente una regresión lineal de series de tiempo los valores de YYY contra términos de error anterior et,...,et−net,...,et−ne_t,..., e_{t-n} . Es decir, la observación YYY es retrocedido primero...
Tengo seis variables dependientes (datos de conteo) y varias variables independientes, veo que en un MMR el script es así: my.model <- lm(cbind(DV1,DV2,DV3,DV4,DV5,DV6) ~ IV1 + IV2 + ... + IVn) Pero, dado que mis datos son recuentos, quiero usar un modelo lineal generalizado y probé...
Estoy haciendo una regresión lineal con una variable dependiente transformada. La siguiente transformación se realizó para que se mantuviera el supuesto de normalidad de los residuos. La variable dependiente no transformada estaba sesgada negativamente, y la siguiente transformación la hizo casi...
Tengo dos series de tiempo: Un proxy para la prima de riesgo de mercado (ERP; línea roja) La tasa libre de riesgo, representada por un bono del gobierno (línea azul) Quiero probar si la tasa libre de riesgo puede explicar el ERP. Por la presente, básicamente seguí el consejo de Tsay (2010, 3a...
Estoy implementando la Regresión de Ridge en un módulo Python / C, y me he encontrado con este "pequeño" problema. La idea es que quiero muestrear los grados efectivos de libertad más o menos equidistantes (como el gráfico de la página 65 en los "Elementos de aprendizaje estadístico" ), es decir,...
Dada una variable dependiente continua yy variables independientes que incluyen una variable ordinal X 1 , ¿cómo encajo un modelo lineal R? ¿Hay documentos sobre este tipo de
Explique brevemente ¿Qué se entiende por interpolación? ¿Cómo se relaciona con el concepto de regresión? La interpolación es el arte de leer entre las líneas de una tabla y, en matemática elemental, el término generalmente denota el proceso de calcular los valores intermedios de una función a...
Ejecuté una regresión con 4 variables, y todas son muy significativas estadísticamente, con valores T y (digo porque parece irrelevante incluir los decimales) que son muy altos y claramente significativos. Pero entonces el es solo .2284. ¿Estoy malinterpretando los valores t aquí para que...
Tengo un conjunto de datos sobre ensayos agrícolas. Mi variable de respuesta es una relación de respuesta: log (tratamiento / control). Estoy interesado en lo que media la diferencia, por lo que estoy ejecutando meta-regresiones RE (sin ponderar, porque parece bastante claro que el tamaño del...
tl; dr: para la regresión OLS, ¿un R cuadrado más alto también implica un valor P más alto? Específicamente para una sola variable explicativa (Y = a + bX + e) pero también estaría interesado en saber para n múltiples variables explicativas (Y = a + b1X + ... bnX + e). Contexto: estoy realizando...
Me preguntaba si hay una relación entre y una prueba F.R2R2R^2 Por lo general, y mide la fuerza del relación lineal en la regresión.R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R^2=\frac {\sum (\hat Y_t - \bar Y)^2 / T-1} {\sum( Y_t - \bar Y)^2 / T-1} Una prueba F solo prueba una...
No estoy acostumbrado a usar variables en el formato de fecha en R. Solo me pregunto si es posible agregar una variable de fecha como una variable explicativa en un modelo de regresión lineal. Si es posible, ¿cómo podemos interpretar el coeficiente? ¿Es el efecto de un día en la variable de...
¡Estoy realmente sorprendido por el hecho de que Poisson GLM acepta números no enteros! Mira: Datos (contenido de data.txt): 1 2001 0.25 1 1 2002 0.5 1 1 2003 1 1 2 2001 0.25 1 2 2002 0.5 1 2 2003 1 1 R script: t <- read.table("data.txt") names(t) <- c('site', 'year', 'count',...