Puntuación de inteligencia al cuadrado y determinación del ganador

Hay un podcast de NPR llamado Intelligence Squared. Cada episodio es una transmisión de un debate en vivo sobre alguna declaración polémica como "La segunda enmienda ya no es relevante" o "La acción afirmativa en los campus universitarios hace más daño que bien". Cuatro representantes debaten: dos a favor y dos en contra.

Para determinar qué lado gana, se encuesta a la audiencia antes y después del debate. El lado que ganó más en términos de porcentaje absoluto se considera el ganador. Por ejemplo:

          For    Against  Undecided
 Before   18%      42%       40%
 After    23%      49%       28%

 Winner: Against team -- The motion is rejected.

Intuitivamente, creo que esta medida de éxito es parcial y me pregunto cómo se encuestaría a la audiencia para determinar el ganador de manera justa.

Tres problemas que veo inmediatamente con el método actual:

En los extremos, si un lado comienza con un acuerdo del 100%, solo pueden empatar o perder.
Si no hay indecisos, se puede ver que el lado con menos acuerdo inicial tiene un tamaño de muestra más grande del cual extraer.
No es probable que el lado indeciso esté realmente indeciso. Si suponemos que los dos lados están igualmente polarizados, parece que nuestra creencia previa sobre la población indecisa debería ser $\text{Beta}(\text{# For}, \text{# Against})$ si cada uno se vio obligado a tomar un lado.

Dado que tenemos que confiar en las encuestas de audiencia, ¿hay una manera más justa de juzgar quién gana?

bayesian rating Wesley Tansey
fuente

Creo que algo así como la "Relación a favor y en contra-después" dividida por la "Relación a favor y en contra" (esencialmente una relación de probabilidades) sería una mejor opción. Si es mayor que 1, mejoró las probabilidades, si es menor que 1, no lo hizo.

Glen_b -Reinstate Monica el

Ese fue mi pensamiento inicial también, aunque lo formulé como porcentaje de ganancia. No estoy seguro de cómo demostrar que es una estimación imparcial.

Wesley Tansey

¿Una estimación imparcial de qué? No estoy seguro de que la imparcialidad sea una propiedad especialmente deseable para esto.

Glen_b -Reinstalar a Mónica el

De lo bien que hizo cada lado. Idealmente, no querríamos sesgar el resultado en función de la respuesta inicial de la multitud. O puedo estar pensando en esto completamente mal ...

Wesley Tansey

Ah, creo que estamos usando sesgo de una manera ligeramente diferente allí. Si mi sugerencia es parcial en ese sentido depende de qué es exactamente lo que estás tratando de medir. Según una medida popular, se trata perfectamente ese problema.

Glen_b -Reinstate Monica el

Respuestas:

Sus preocupaciones están bien fundadas. Desafortunadamente, hay muchas formas objetivas y defendibles para resolver este problema y pueden entrar en conflicto entre sí. El siguiente análisis proporciona un marco para decidir cómo es posible que desee evaluar el resultado y muestra cuán dependientes son sus conclusiones de los supuestos que hace sobre la dinámica de la situación.

Tenemos poco o ningún control sobre la audiencia inicial. Es posible que no represente una población mayor (como todos los espectadores) en la que estamos más interesados. Por lo tanto, el número absoluto de opiniones tiene poca relevancia: lo que importa son las tasas a las que las personas pueden cambiar de opinión. (A partir de estas tasas, podríamos estimar cómo podría cambiar la población que escucha, dada la información sobre sus opiniones iniciales, incluso cuando las proporciones de opiniones en la audiencia que escuchan difieren de la audiencia del estudio que se encuestó).

Por lo tanto, el resultado consiste en seis posibles cambios de opinión y seis tasas de cambio asociadas:

Aquellos "para", a quienes indexaré con pueden cambiar de opinión y terminar en contra (con índice ) a tasa de o indecisos (con índice ) a tasa de . $1,$ $2$ $a_{12}$ $3$ $a_{13}$
Aquellos "en contra" pueden cambiar de opinión a "a favor" a tasa de o "indecisos" a tasa de . $a_{21}$ $a_{23}$
Los indecisos pueden cambiar de opinión a "para" a una tasa o "en contra" a una tasa $a_{31}$ $a_{32}.$

Definir , para siendo la proporción de personas de índice no cambiantes sus mentes. $a_{ii}$ $i=1,2,3,$ $i$

Las columnas de la matriz contienen números no negativos que deben sumarse a la unidad (suponiendo que todos los que responden a la encuesta inicial también respondan a la última). Eso deja seis valores independientes para determinar en función de la transición de la distribución inicial en la audiencia, , a la distribución final $\mathbb{A}=(a_{ij})$ $x=(0.18, 0.42, 0.40)$ $y=(0.23, 0.49, 0.28) = \mathbb{A}x$ . Este es un sistema subdeterminado de ecuaciones lineales (restringidas), que deja una tremenda flexibilidad para derivar una solución. Veamos tres soluciones.

Solución 1: menor cambio

Podríamos pedirle a la matriz de transición que sea lo más pequeña posible en algún sentido. Una forma es minimizar las proporciones totales de personas que cambian de opinión. Esto se logra en el ejemplo con la solución $\mathbb{A}$

A = (\begin{array}{ccc} 1 & 0 & 0.125 \\ 0 & 1 & 0.175 \\ 0 & 0 & 0.700 \end{array}) .

$\mathbb{A}=\left( \begin{array}{ccc} 1 & 0 & 0.125 \\ 0 & 1 & 0.175 \\ 0 & 0 & 0.700 \\ \end{array} \right).$

Es decir, el de los indecisos terminaron a favor, el de ellos terminaron en contra, y ninguno de los pro o contra originales cambió de opinión. ¿Quien ganó? Los contras, obviamente, porque el debate persuadió a una mayor proporción de indecisos a conformarse con la opinión "en contra". $12.5\%$ $17.5\%$

Este modelo sería apropiado cuando creas que las facciones iniciales se endurecen con sus opiniones y las únicas personas que probablemente cambien de opinión se encuentran entre las declaradas inicialmente como indecisas.

Solución 2: mínimos cuadrados

Una solución matemáticamente simple es encontrar la matriz cuya norma cuadrado es lo más pequeño posible: esto minimiza la suma de los cuadrados de las nueve probabilidades de transición (que incluyen el representa las proporciones que no cambian de opinión). Su solución (redondeada a dos decimales) es $\mathbb{A}$ $L^2$ $||\mathbb{A}||_2^2 = tr(\mathbb{A}^\prime \mathbb{A})$ $a_{ii}$

A = (\begin{array}{ccc} 0.28 & 0.22 & 0.22 \\ 0.41 & 0.51 & 0.50 \\ 0.31 & 0.27 & 0.28 \end{array}) .

$\mathbb{A} = \left( \begin{array}{ccc} 0.28 & 0.22 & 0.22 \\ 0.41 & 0.51 & 0.50 \\ 0.31 & 0.27 & 0.28 \\ \end{array} \right).$

Comparando las filas, vemos que aunque el del lado "en contra" fue persuadido para que se convirtiera a "para" (y otro estaba lo suficientemente confundido como para volverse indeciso), el del lado "para" se convirtió (y otro estaba confundido). Los indecisos originales tendían a convertirse al lado "en contra" ( versus ). Ahora "contra" es el claro ganador. $22\%$ $27\%$ $41\%$ $31\%$ $50\%$ $22\%$

$1/3$

Solución 3: mínimos cuadrados penalizados

$\mathbb{A}$ $\omega_i$ $\mathbb{A}$

| | A | |_{2}^{2} - ω_{1} a_{11} - ω_{2} a_{22} - ω_{3} a_{33}

$||\mathbb{A}||_2^2 - \omega_1 a_{11} - \omega_2 a_{22} - \omega_3 a_{33}$

$\omega = (1,1,1/2)$

A = (\begin{array}{ccc} 0.91 & 0 & 0.17 \\ 0.03 & 0.93 & 0.23 \\ 0.06 & 0.07 & 0.60 \end{array}) .

$\mathbb{A} = \left( \begin{array}{ccc} 0.91 & 0 & 0.17 \\ 0.03 & 0.93 & 0.23 \\ 0.06 & 0.07 & 0.60 \\ \end{array} \right).$

$40\%$ $17\%$ $23\%$

Resumen

En este modelo de transición de cambio de opinión, la mayoría de los métodos de solución indican una victoria para el lado "contra" en este ejemplo particular. En ausencia de opiniones fuertes sobre la dinámica del cambio, eso sugiere que el lado "en contra" ganó.

$(.20,.60,.20)$ $(.30,.40,.30)$ $20\%$ $30\%$ $40\%$ $30\%$ . Sin embargo, la solución de mínimos cuadrados (redondeada) al menos sugiere que hay una forma en que esto podría suceder en la que el debate favoreció ligeramente a la otra parte. Es

A = (\begin{array}{ccc} 0.32 & 0.29 & 0.32 \\ 0.36 & 0.42 & 0.36 \\ 0.32 & 0.29 & 0.32 \end{array}) .

$\mathbb{A} = \left( \begin{array}{ccc} 0.32 & 0.29 & 0.32 \\ 0.36 & 0.42 & 0.36 \\ 0.32 & 0.29 & 0.32 \\ \end{array} \right).$

$36\%$ $29\%$ $(36\%)$ $32\%$

Comentarios adicionales

$\mathbb{A}$

whuber
fuente

Gracias por la publicación detallada! Sin embargo, me preocupa que todos estos métodos no consideren la posibilidad de que los indecisos no estén realmente indecisos.

Wesley Tansey

Tienen la flexibilidad de incorporar su preocupación por esa posibilidad. Todavía está atrapado con la necesidad de hacer suposiciones (fuertes): si cree que no están realmente decididas, tendrá que estimar qué proporción es "a favor" y qué proporción "en contra" (y sería una locura suponer las proporciones son las mismas que el número para: ¡número contra!) Una forma de eludir dicha estimación, aunque solo sea para ver cómo podría ser el resultado, es elegir una solución que recompense un cambio de opinión de una persona indecisa.

whuber

Suponiendo que ambos lados estén igualmente polarizados, ¿no sería su estimación MAP de las personas indecisas la relación a favor: en contra?

Wesley Tansey

En la mayoría de los casos, sería difícil apoyar tal suposición. Por ejemplo, las personas menos informadas pueden tener una mayor tendencia a ser indecisas, y también tienen una mayor tendencia a favorecer una de las dos posiciones. El efecto de una suposición "igualmente polarizante" podría ser tan fuerte (especialmente cuando hay una gran proporción de indecisos) como para hacer que el análisis posterior no sea relevante: los resultados serían principalmente una consecuencia de esa suposición. Una línea de pensamiento productiva para usted podría ser considerar recopilar información adicional sobre las personas indecisas.

whuber

p ({for}_{after}, {against}_{after}, {undecided}_{after} ∣ {for}_{before}, {against}_{before}, {undecided}_{before})

$\begin{equation} p(\textrm{for}_\textrm{after},\textrm{against}_{\textrm{after}},\textrm{undecided}_{\textrm{after}} \mid \textrm{for}_\textrm{before},\textrm{against}_{\textrm{before}},\textrm{undecided}_{\textrm{before}}) \end{equation}$

0.5

$0.5$ para ambos equipos Tenga en cuenta que todavía hay múltiples opciones para la regla de decisión, ya que el espacio de resultados es bidimensional pero, si confiamos en el modelo predictivo, esto no importa en términos de equidad del concurso. Uno podría, por ejemplo, simplemente decidir que el equipo a favor gana si la proporción a favor y en contra después del debate excede su mediana predictiva (condicional en la encuesta previa).

Ideas para construir un modelo predictivo

\begin{aligned} (P (for ∣ for before), P (ud ∣ for before), P (ag ∣ for before)) & \sim D i r (a_{f f}, a_{u f}, a_{a f}) \\ (P (for ∣ ud before), P (ud ∣ ud before), P (ag ∣ ud before)) & \sim D i r (a_{f u}, a_{u u}, a_{a u}) \\ (P (for ∣ ag before), P (ud ∣ ag before), P (ag ∣ ag before)) & \sim D i r (a_{f a}, a_{u a}, a_{a a}), \end{aligned}

$\begin{align} (P(\textrm{for} \mid \textrm{for before}),P(\textrm{ud} \mid \textrm{for before}),P(\textrm{ag} \mid \textrm{for before})) & \sim Dir(a_{ff},a_{uf},a_{af}) \\ (P(\textrm{for} \mid \textrm{ud before}),P(\textrm{ud} \mid \textrm{ud before}),P(\textrm{ag} \mid \textrm{ud before})) & \sim Dir(a_{fu},a_{uu},a_{au}) \\ (P(\textrm{for} \mid \textrm{ag before}),P(\textrm{ud} \mid \textrm{ag before}),P(\textrm{ag} \mid \textrm{ag before})) & \sim Dir(a_{fa},a_{ua},a_{aa}), \end{align}$

P

$P$

a

$a$

a

$a$

a

$a$

a_{f f} = a_{a a}

$a_{ff}=a_{aa}$

a_{f u} = a_{a u}

$a_{fu}=a_{au}$

$a$

Juho Kokkala
fuente

¿Podría ampliar la idea de un modelo predictivo con un ejemplo?

Wesley Tansey

@WesleyTansey Me di cuenta de que uno podría usar la idea de Whuber de considerar las probabilidades de transición para construir un modelo predictivo a los fines de mi respuesta. Edité mi respuesta para contener algunas ideas iniciales, pero no he intentado implementar esto ni estoy planeando hacerlo.

Juho Kokkala