Estoy trabajando a través de los ejemplos en el análisis de datos bayesianos de Kruschke , específicamente el ANOVA exponencial de Poisson en el cap. 22, que presenta como una alternativa a las pruebas de independencia chi-cuadrado de independencia para tablas de contingencia.
Puedo ver cómo obtenemos información sobre las interacciones que ocurren con más o menos frecuencia de lo que se esperaría si las variables fueran independientes (es decir, cuando el IDH excluye cero).
Mi pregunta es ¿cómo puedo calcular o interpretar un tamaño de efecto en este marco? Por ejemplo, Kruschke escribe "la combinación de ojos azules con cabello negro ocurre con menos frecuencia de lo que se esperaría si el color de los ojos y el color del cabello fueran independientes", pero ¿cómo podemos describir la fuerza de esa asociación? ¿Cómo puedo saber qué interacciones son más extremas que otras? Si hiciéramos una prueba de chi-cuadrado de estos datos, podríamos calcular la V de Cramér como una medida del tamaño del efecto general. ¿Cómo expreso el tamaño del efecto en este contexto bayesiano?
Aquí está el ejemplo autónomo del libro (codificado R
), en caso de que la respuesta se me oculte a simple vista ...
df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15,
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond",
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))
df
Blue Brown Green Hazel
Black 20 68 5 15
Blond 94 7 16 10
Brunette 84 119 29 54
Red 17 26 14 14
Aquí está la salida frecuentista, con medidas de tamaño del efecto (no en el libro):
vcd::assocstats(df)
X^2 df P(> X^2)
Likelihood Ratio 146.44 9 0
Pearson 138.29 9 0
Phi-Coefficient : 0.483
Contingency Coeff.: 0.435
Cramer's V : 0.279
Aquí está la salida bayesiana, con IDH y probabilidades de celda (directamente del libro):
# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
"http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R",
"http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")
# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))
# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))
Y aquí hay gráficos del modelo exponencial posterior de Poisson aplicado a los datos:
Y gráficas de la distribución posterior en las probabilidades de células estimadas:
R
para mostrar cómo se puede programar?sd ()
combinadas con una de las funciones "aplicar". En cuanto a los diagramas de caja, estos son simples para obtener los básicosboxplot ()
.