Estoy usando el paquete 'lars' en R con el siguiente código: > library(lars) > set.seed(3) > n <- 1000 > x1 <- rnorm(n) > x2 <- x1+rnorm(n)*0.5 > x3 <- rnorm(n) > x4 <- rnorm(n) > x5 <- rexp(n) > y <- 5*x1 + 4*x2 + 2*x3 + 7*x4 + rnorm(n) > x <-...
Estoy usando el paquete 'lars' en R con el siguiente código: > library(lars) > set.seed(3) > n <- 1000 > x1 <- rnorm(n) > x2 <- x1+rnorm(n)*0.5 > x3 <- rnorm(n) > x4 <- rnorm(n) > x5 <- rexp(n) > y <- 5*x1 + 4*x2 + 2*x3 + 7*x4 + rnorm(n) > x <-...
Quiero predecir Tree Heights en un área determinada usando algunas variables obtenidas a través de la teledetección. Como la biomasa aproximada, etc. Quiero usar primero una regresión lineal (sé que no es la mejor idea, pero es un paso obligado para mi proyecto). Quería saber qué tan mal puede...
Quiero probar una correlación de muestra rrr para significancia, usando valores p, es decir H0:ρ=0,H1:ρ≠0.H0:ρ=0,H1:ρ≠0.H_0: \rho = 0, \; H_1: \rho \neq 0. He entendido que puedo usar la transformación z de Fisher para calcular esto zobs=n−3−−−−−√2ln(1+r1−r)zobs=n−32ln(1+r1−r)z_{obs}=...
Para comenzar, tengo una base matemática bastante profunda, pero nunca me he ocupado realmente de series de tiempo o modelos estadísticos. Así que no tienes que ser muy amable conmigo :) Estoy leyendo este documento sobre el modelado del uso de energía en edificios comerciales, y el autor hace...
Estoy obteniendo algunos resultados desconcertantes para la correlación de una suma con una tercera variable cuando los dos predictores están correlacionados negativamente. ¿Qué está causando estos resultados desconcertantes? Ejemplo 1: correlación entre la suma de dos variables y una tercera...
¿Son los coeficientes de correlación phi y Matthews el mismo concepto? ¿Cómo se relacionan o equivalen al coeficiente de correlación de Pearson para dos variables binarias? Supongo que los valores binarios son 0 y 1. La correlación de Pearson entre dos variables aleatorias de Bernoulli e...
Estoy arrojando aquí el problema tal como lo recibí. Tengo dos variables aleatorias. Uno de los cuales es continuo (Y) y el otro es discreto y se abordará como ordinal (X). Puse debajo de la trama que recibí junto con la consulta. La persona que me envía los datos quiere medir la fuerza de la...
Estoy tratando de evaluar una prueba de elección múltiple de 20 ítems. Quiero realizar un análisis de elementos como el que se puede encontrar en este ejemplo . Entonces, para cada pregunta, quiero el valor P y la correlación con el total, y la distribución de las opciones seleccionadas. No sé...
Ya he leído todas las páginas de este sitio tratando de encontrar la respuesta a mi problema, pero nadie parece ser el correcto ... Primero te explico el tipo de datos con los que estoy trabajando ... Digamos que tengo un vector de matriz con varios nombres de ciudad, uno para cada uno de los 300...
Soy nuevo en el aprendizaje automático, así que estoy tratando de encontrar algo de literatura, pero ni siquiera estoy seguro de qué buscar en Google. Mis datos son de la siguiente forma: User A performs Action P User B performs Action Q User C performs Action R ... User C performs Action X User A...
Tengo un problema para calcular el coeficiente de correlación de Pearson de los conjuntos de datos con una desviación estándar posiblemente cero (es decir, todos los datos tienen el mismo valor). Supongamos que tengo los siguientes dos conjuntos de datos: float x[] = {2, 2, 2, 3, 2}; float y[] =...
¿Wikipedia está mal ... o no lo entiendo? Wikipedia: Los cuadrados blanco y negro ("patrón de ajedrez") están perfectamente dispersos, por lo que el de Moran sería −1. Si los cuadrados blancos se apilaran en la mitad del tablero y los cuadrados negros en la otra, el de Moran estaría cerca de +1....
En el modelado multinivel, la correlación intraclase a menudo se calcula a partir de un ANOVA de efectos aleatorios yyo j= γ00+ uj+ eyo jyyoj=γ00+tuj+miyoj y_{ij} = \gamma_{00} + u_j + e_{ij} donde son los residuos de nivel 2 y son los residuos de nivel 1. Luego obtenemos estimaciones, y para la...
Tengo este gran conjunto de datos con 2500 variables y 142 observaciones. Quiero ejecutar una correlación entre la Variable X y el resto de las variables. Pero para muchas columnas, faltan entradas. Traté de hacer esto en R usando el argumento "pairwise-complete" ( use=pairwise.complete.obs) y...
He notado en mi propio trabajo este patrón al examinar un correlograma espacial a diferentes distancias, emerge un patrón en forma de U en las correlaciones. Más específicamente, las fuertes correlaciones positivas en contenedores de pequeña distancia disminuyen con la distancia, luego alcanzan un...
Tengo un conjunto de datos muy grande y faltan alrededor del 5% de valores aleatorios. Estas variables están correlacionadas entre sí. El siguiente conjunto de datos R de ejemplo es solo un ejemplo de juguete con datos correlacionados ficticios. set.seed(123) # matrix of X variable xmat <-...
¿Qué expresan los términos orden de correlación cero, primero, segundo, tercero, etc.?
Dibujamos muestras, cada una de tamaño , independientemente de una distribución Normal .n ( μ , σ 2 )NNNnnn(μ,σ2)(μ,σ2)(\mu,\sigma^2) De las muestras, elegimos las 2 muestras que tienen la correlación de Pearson más alta (absoluta) entre sí.NNN ¿Cuál es el valor esperado de esta...
La correlación, , es una medida de asociación lineal entre dos variables. El coeficiente de determinación, , es una medida de cuánto de la variabilidad en una variable puede "explicarse por" la variación en la otra.r 2rrrr2r2r^2 Por ejemplo, si es la correlación entre dos variables, entonces . Por...
Cuando hace una regresión OLS y traza los residuos resultantes, ¿cómo puede saber si los residuos están autocorrelacionados? Sé que hay pruebas para esto (Durbin, Breusch-Godfrey), pero me preguntaba si puede mirar un diagrama para evaluar si la autocorrelación podría ser un problema (porque para...