Cómo expresar celdas de una tabla 2x2 en términos de coeficiente phi y probabilidades marginales

8

Considere una tabla típica de frecuencias de 2x2 (que se muestra en esta imagen): Notación: La variable de fila se denota R y toma los valores 0 o 1; la variable de columna se denota C y toma valores 0 o 1. Las celdas de la tabla indican la frecuencia de cada combinación de R y C; por ejemplo, es la frecuencia de R = 0 y C = 1. Para los propósitos de mi pregunta, suponga que los recuentos de celdas se dividen por el total, de modo que los valores de las celdas son las probabilidades conjuntas de las celdas .
mesa de dos por dos
b

Quiero expresar las probabilidades de la celda en términos del coeficiente phi (que es una medida de correlación con la fórmula que se proporciona a continuación) y las probabilidades marginales: y . Es decir, quiero invertir el siguiente sistema de cuatro ecuaciones: y, por supuesto, . En otras palabras, me gustaría resolver , , , y en términos deμRp(R=1)=c+dμCp(C=1)=b+d

(by defn)ϕ(adbc)/(a+b)(c+d)(a+c)(b+d)(by defn)μR=c+d(by defn)μC=b+d(constraint)1=a+b+c+d
0a,b,c,d1abcdϕ , y .μRμC

Probablemente, este problema ya haya sido resuelto anteriormente, pero mis búsquedas no han dado lugar a una fuente, y mis débiles intentos de álgebra no han producido una respuesta, y no puedo encontrar inversores en línea de ecuación de sistema (no lineal) que manejen este caso .

John K. Kruschke
fuente

Respuestas:

4

Reconocemos fácilmente todos los factores en el denominador de , porque y . Comencemos, por lo tanto, con una pequeña simplificación para evitar escribir muchas raíces cuadradas:ϕa+b=1μRa+c=1μC

Δ=adbc=ϕμR(1μR)μC(1μC).

Encontremos :d

d=(1)d=(a+b+c+d)d=ad+bd+cd+d2=ad+(bc+bc)+bd+cd+d2=(adbc)+(c+d)(b+d)=Δ+μRμC.

Encontrar , , y procede de manera similar debido a las simetrías del problema: intercambiando las columnas permutas y , y , mientras que el cambio a y negando , donde abcabcdμC1μCΔ

c=Δ+μR(1μC).

Intercambiando las permutas de filas y , y , mientras que el cambio a y negando , de dondeacbdμR1μRΔ

b=Δ+(1μR)μC.

Al intercambiar tanto filas como columnas se obtienen

a=Δ+(1μR)(1μC).

Dadas estas expresiones para , es simple verificar que y , y solo un poco más difícil de verifique que .a,b,c,da+b+c+d=1,c+d=μR,b+d=μCadbc=Δ

whuber
fuente
Una nota para otros que podrían usar esta respuesta (¡correcta!): Puede producir valores de a, b, c o d que son negativos. En otras palabras, no todas las combinaciones de phi en [-1,1], mu_R en [0,1] y mu_C en [0,1] pueden crearse mediante matrices de probabilidad. Para whuber: ¡Gracias!
John K. Kruschke
Eso es correcto, John, pero no mencioné ese hecho porque presumiblemente , y habían obtenido de una tabla válida en primer lugar. Asumiendo que y son frecuencias válidas (en el intervalo ), será real. Debe estar en el intervaloμRμCϕμRμC[0,1]Δ
[min(μRμC,(1μR)(1μC)), min(μR(1μC),(1μR)μC)].
whuber