Imagine una situación: tenemos registros históricos (20 años) de tres minas. ¿La presencia de plata aumenta la probabilidad de encontrar oro en el próximo año? ¿Cómo probar tal pregunta?
Aquí hay datos de ejemplo:
mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
"rock","rock","rock","rock","silver","rock","rock",
"rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
"silver","gold","gold","gold","gold","gold","rock",
"silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
"rock","silver","rock","rock","rock","rock","silver",
"gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)
r
time-series
hypothesis-testing
stochastic-processes
Ladislav Naďo
fuente
fuente
Respuestas:
Mi mejor intento: ... el uso de matrices de transición sugeridas por @AndyW probablemente no sea la solución que estoy buscando (según el comentario de @ Tim). Así que probé un enfoque diferente. Encontré este enlace que trata sobre cómo hacer una regresión logística donde la variable de respuesta yy la variable de predicción x son binarias .
Según el ejemplo, debería crear una tabla 2 × 2 basada en mis datos:
Cómo extraje los valores:
Y construir un modelo:
¿Es una buena solución? ¿El valor p (0.673) significa que la presencia de plata no aumenta la probabilidad de encontrar oro?
fuente
yes = c(2, 14), no = c(7, 34)
, lo que significa que pone Silver: sí primero. Entonces, cuando hacesas.factor(c(0, 1))
el 0 corresponde a plata: sí, que es tu nivel de referencia y, por lo tanto, tu intercepción. El valor p de 0,67 corresponde al pequeño golpe positivo que obtienes en la probabilidad de encontrar oro moviéndose de plata: sí a plata: no.