El caso de discriminación asiática de Palantir: ¿cómo se calcularon las probabilidades?

Leí este artículo sobre el caso de Palantir, donde el Departamento de Trabajo los acusa de discriminación contra los asiáticos. ¿Alguien sabe de dónde obtuvieron estas estimaciones de probabilidad?

No obtengo 1/741 en el artículo (a).

(a) Para el puesto de Ingeniero de Control de Calidad, de un grupo de más de 730 solicitantes calificados, aproximadamente el 77% de los cuales eran asiáticos, Palantir contrató a seis solicitantes no asiáticos y solo un solicitante asiático. El impacto adverso calculado por OFCCP excede tres desviaciones estándar. La probabilidad de que este resultado ocurra de acuerdo con el azar es aproximadamente uno de cada 741.

(b) Para el puesto de Ingeniero de Software, de un grupo de más de 1,160 solicitantes calificados, aproximadamente el 85% de los cuales eran asiáticos, Palantir contrató a 14 solicitantes no asiáticos y solo 11 solicitantes asiáticos. El impacto adverso calculado por OFCCP excede las cinco desviaciones estándar. La probabilidad de que este resultado ocurra de acuerdo con el azar es de aproximadamente uno en 3.4 millones.

(c) Para el puesto de pasante de ingeniero de control de calidad, de un grupo de más de 130 solicitantes calificados, aproximadamente el 73% de los cuales eran asiáticos, Palantir contrató a 17 solicitantes no asiáticos y solo cuatro solicitantes asiáticos. El impacto adverso calculado por OFCCP excede seis desviaciones estándar. La probabilidad de que este resultado ocurra de acuerdo con el azar es de aproximadamente uno de cada mil millones.

probability p-value contingency-tables legal Aksakal
fuente

¿Puedes mostrar el cálculo que hiciste para obtener algo que no sea 1/741?

Ben Bolker

Mi estimación fue unilateral: si la duplica para hacerla como una prueba de hipótesis de dos lados, se acerca bastante a ese número 1/741.

Gregor - reinstala a Monica el

Estoy de acuerdo en que duplicar no tiene ningún sentido en este caso, solo estaba tratando de adivinar lo que podría haberse hecho. La pregunta no es cuál es la respuesta correcta, sino cómo llegaron a esta estimación .

Gregor - readmitir a Mónica

Sería genial si alguien convirtiera la captura de pantalla PDF en una cita de texto ...

ameba dice Reinstate Monica

Logré OCR tu captura de pantalla usando finereaderonline.com .

ameba dice Reinstate Monica

Respuestas:

Voy a hacer ingeniería inversa de esto por experiencia con casos de discriminación. Definitivamente puedo establecer de dónde provienen los valores de "uno en 741" , etc. Sin embargo, se perdió tanta información en la traducción que el resto de mi reconstrucción se basa en haber visto cómo las personas hacen estadísticas en la sala del tribunal. Solo puedo adivinar algunos de los detalles.

Desde el momento en que se aprobaron las leyes contra la discriminación en la década de 1960 (Título VI), los tribunales de los Estados Unidos han aprendido a analizar los valores p y compararlos con umbrales de y . También han aprendido a observar los efectos estandarizados, típicamente denominados "desviaciones estándar", y compararlos con un umbral de "dos a tres desviaciones estándar". Con el fin de establecer un caso prima facie para una demanda por discriminación, los demandantes generalmente intentan un cálculo estadístico que muestre un "impacto dispar" que exceda estos umbrales. Si tal cálculo no puede ser soportado, el caso generalmente no puede avanzar. $0.05$ $0.01$

Los expertos en estadísticas de los demandantes a menudo intentan expresar sus resultados en estos términos familiares. Algunos de los expertos llevan a cabo una prueba estadística en la cual la hipótesis nula expresa "ningún impacto adverso", suponiendo que las decisiones de empleo fueron puramente aleatorias y no fueron controladas por ninguna otra característica de los empleados. (Si se trata de una alternativa de una o dos colas puede depender del experto y las circunstancias). Luego convierten el valor p de esta prueba en una serie de "desviaciones estándar" al referirse a la distribución Normal estándar. - incluso cuando la Normal estándar es irrelevante para la prueba original. De esta manera indirecta, esperan comunicar sus conclusiones claramente al juez.

La prueba preferida para los datos que se pueden resumir en tablas de contingencia es la prueba exacta de Fisher. La aparición de "Exacto" en su nombre es particularmente agradable para los demandantes, porque connota una determinación estadística que se ha hecho sin error (¡lo que sea que sea!).

Aquí, entonces, está mi (reconstrucción especulativa) de los cálculos del Departamento de Trabajo.

$\chi^2$
Convirtieron su valor p en una puntuación Z normal ("número de desviaciones estándar").
Se redondean la puntuación Z al entero más próximo: "excede tres desviaciones estándar", "excede cinco desviaciones estándar" y "excede de seis desviaciones estándar". (Debido a que algunas de estas puntuaciones Z redondea el arriba a las desviaciones estándar más, no puedo justificar la "excede"; todo lo que puedo hacer es citar a ella).
En la queja, estas puntuaciones Z integrales se convirtieron nuevamente a valores p. Nuevamente se usó la distribución normal estándar.
Estos valores p se describen (posiblemente de manera engañosa) como "la probabilidad de que este resultado ocurra de acuerdo con el azar".

$1/1280$ $1/565000$ $1/58000000$ $730$ $1160$ $130$ $730$ $1160$ $130$ $-3.16$ $-4.64$ $-5.52$ $1/741$ $1/3500000$ $1/1000000000$

Aquí hay un Rcódigo utilizado para realizar estos cálculos.

f <- function(total, percent.asian, hired.asian, hired.non.asian) {
  asian <- round(percent.asian/100 * total)
  non.asian <- total-asian
  x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
              nrow = 2,
              dimnames=list(Race=c("Asian", "non-Asian"),
                            Status=c("Not hired", "Hired")))
  s <- fisher.test(x)
  s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))

whuber
fuente

Wow, no podría adivinar que esto podría hacerse. Esto da miedo.

Aksakal

(+1) CSI: Estadísticas.

Firebug

Cómo calcular pvals correctamente usando la distribución hipergeométrica:

$k$ $n$ $K$ $N$

Para una prueba unilateral, en MATLAB, puede llamar pval = hygecdf(k, N, K, n);o, en este caso, pval = hygecdf(1, 730, 562, 7)aproximadamente .0007839.

La media y la desviación estándar están dadas por:

μ = norte \frac{K}{norte} s = \sqrt{norte \frac{K}{norte} \frac{norte - K}{norte} \frac{norte - norte}{norte - 1}}

$\mu = n \frac{K}{N} \quad \quad \quad s = \sqrt{n \frac{K}{N} \frac{N - K}{N} \frac{N - n}{N-1}}$

$\chi^2$

Buscando las fórmulas que la OFCCP podría usar, este sitio que vi puede ser útil: http://www.hr-software.net/EmploymentStatistics/DisparateImpact.htm

Resumen de algunos cálculos:

\begin{array}{rrrr} Número y método & Parte A & Parte B & Parte c \\ PVal de CDF hipergeométrica & 7.839e-04 & 1.77e-06 & 1.72e-08 \\ χ^{2} stat & 15,68 & 33,68 & 37,16 \\ χ^{2} pval & 7.49e-05 & 6,47e-09 & 1.09e-09 \\ Pval del documento anterior & .00135 & 2.94e-07 & 1.00e-09 \end{array}

$\begin{array}{rrrr} \text{Number and method} & \text{Part A} & \text{Part B} & \text{Part C} \\ \text{PVal from hypergeometric CDF} & \text{7.839e-04} & \text{1.77e-06} & \text{1.72e-08}\\ \chi^2 \text{ stat} & 15.68 & 33.68 & 37.16\\ \chi^2 \text{ pval} & \text{7.49e-05} & \text{6.47e-09} & \text{1.09e-09} \\ \text{Pval from above document} & .00135 & \text{2.94e-07} & \text{1.00e-09} \end{array}$

$\chi^2$ $\sum \frac{(\text{expected} - \text{actual})^2}{\text{expected}}$

Matthew Gunn
fuente

Obtuve el mismo resultado pero de manera diferente. No está cerca de 1/741

Aksakal