Cómo comprobar si el "estado anterior" influye en el "estado posterior" en R

10

Imagine una situación: tenemos registros históricos (20 años) de tres minas. ¿La presencia de plata aumenta la probabilidad de encontrar oro en el próximo año? ¿Cómo probar tal pregunta?


ingrese la descripción de la imagen aquí

Aquí hay datos de ejemplo:

mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
            "rock","rock","rock","rock","silver","rock","rock",
            "rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
            "silver","gold","gold","gold","gold","gold","rock",
            "silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
            "rock","silver","rock","rock","rock","rock","silver",
            "gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)

Ladislav Naďo
fuente
1
Puede interesarle calcular matrices de transición .
Andy W
Hola @AndyW! Gracias por su comentario. Estoy familiarizado con el paquete de matrices de transición: makkovchain - markovchainFit (). ¿Puedo usar los valores de probabilidad de la matriz de transición como valores p? ¿Hay alguna forma de probar la hipótesis: "Existe una relación" plata-oro "". (valor p = xx)?
Ladislav Naďo
1
Las probabilidades de transición de @LadislavNado no pueden interpretarse como valores p (no le dicen nada acerca de rechazar cualquier H0), consulte stats.stackexchange.com/questions/31/… para obtener más información sobre los valores p.
Tim
1
Veo un problema con la forma en que extrajo sus datos. Considere su escenario "plata: no" y "oro: sí", también debe contar sus carreras consecutivas de "oro", ya que cumple con los criterios lógicos.
1
Con una celda corregida del 1 al 14, el modelo cambia a: Coeficientes: Est. Estándar. Error z valor Pr (> | z |) (Intercepción) -1.2528 0.8018 -1.562 0.118 as.factor (c (0, 1)) 1 0.3655 0.8624 0.424 0.672

Respuestas:

4

Mi mejor intento: ... el uso de matrices de transición sugeridas por @AndyW probablemente no sea la solución que estoy buscando (según el comentario de @ Tim). Así que probé un enfoque diferente. Encontré este enlace que trata sobre cómo hacer una regresión logística donde la variable de respuesta yy la variable de predicción x son binarias .

Según el ejemplo, debería crear una tabla 2 × 2 basada en mis datos:

               gold (yes)  gold (no)
silver (yes)       2           7
silver (no)       14          34

Cómo extraje los valores: ingrese la descripción de la imagen aquí

Y construir un modelo:

response <- cbind(yes = c(2, 14), no = c(7, 34))

mine.logistic <- glm(response ~ as.factor(c(0,1)),
                      family = binomial(link=logit))

summary(mine.logistic)
# Coefficients:
#                     Estimate Std. Error z value Pr(>|z|)
# (Intercept)          -1.2528     0.8018  -1.562    0.118
# as.factor(c(0, 1))1   0.3655     0.8624   0.424    0.672

¿Es una buena solución? ¿El valor p (0.673) significa que la presencia de plata no aumenta la probabilidad de encontrar oro?

Ladislav Naďo
fuente
¿Cómo generaste estos buenos gráficos? Tikz?
shadowtalker
Hola @ssdecontrol! Los gráficos se hicieron a mano en Inkscape.
Ladislav Naďo
Sí, esa es una interpretación decente. Además, si solo mira las filas de su tabla 2x2, en la fila superior (plata: sí) tiene 9 casos, 2 de los cuales tenían oro, por lo que dada la probabilidad de plata de oro el próximo año es 2/9 = 0.222. En la fila inferior (plata: no) tiene 48 casos, 14 de los cuales tenían oro el próximo año, por lo que dada la probabilidad de plata de oro es 14 / (14 + 34) = 0.292. Dado todo eso, parece que la plata perjudica su posibilidad de encontrar oro, aunque a partir de sus valores p no es "estadísticamente significativo".
Gregor Thomas
También tenga en cuenta su codificación, comienza yes = c(2, 14), no = c(7, 34), lo que significa que pone Silver: sí primero. Entonces, cuando haces as.factor(c(0, 1))el 0 corresponde a plata: sí, que es tu nivel de referencia y, por lo tanto, tu intercepción. El valor p de 0,67 corresponde al pequeño golpe positivo que obtienes en la probabilidad de encontrar oro moviéndose de plata: sí a plata: no.
Gregor Thomas
Un último comentario: que están utilizando matrices de transición. Su matriz 2, 7, 14, 34 es una matriz de transición.
Gregor Thomas