¿Cuál es la mejor aproximación para el voto mayoritario?

18

La operación de votación mayoritaria aparece con bastante frecuencia en la tolerancia a fallas (y sin duda en otros lugares), donde la función genera un bit igual al valor que aparece con mayor frecuencia en el valor de los bits de entrada. Para simplificar, supongamos que cada vez que la entrada contiene un número igual de bits en el estado 0 y el estado 1, genera 0.

Esto se puede generalizar a dits donde hay más de 2 posibilidades para cada entrada devolviendo el valor que ocurre con mayor frecuencia en la entrada y, en el caso de un empate, devolviendo el valor más frecuente que viene primero lexicográficamente. Llamemos a esta función "voto de pluralidad".

Estoy interesado en la salida de dicha función cuando cada entrada tiene una distribución de probabilidad fija (y la distribución es la misma para cada dit en la entrada). Específicamente me importa la siguiente pregunta.

Dado un conjunto S={S1,S2,...,Sn} , si el conjunto se muestrea aleatoriamente independientemente N veces, con probabilidad pi de elegir el elemento ith de S cada vez, para una elección fija de v ¿cuál es la probabilidad de que la pluralidad vote de estas salidas Sv ?

Ahora, es sencillo calcular la respuesta exacta a la pregunta anterior como una suma sobre distribuciones multinomiales. Sin embargo, para mis propósitos, esto es menos que ideal, y una aproximación cerrada sería mejor. Entonces mi pregunta es:

¿Qué aproximación de forma cerrada a la probabilidad anterior tiene el límite más estrecho en la distancia máxima desde el valor exacto?

Joe Fitzsimons
fuente
No lo sé, pero sugeriría la frase de búsqueda "consenso de teoría de control" o "problema de consenso de teoría de control". Es un problema diferente del problema de consenso de computación distribuida, y puede ser lo que necesita.
Aaron Sterling
¿Está buscando una aproximación que funcione bien cuando N es grande en comparación con n? Si es así, la regla de desempate debe ser irrelevante.
Tsuyoshi Ito
@ TsuyoshiIto: Sí, lo soy, y de hecho esa regla es irrelevante, pero quería asegurarme de que la pregunta estuviera bien planteada. Realmente no me importa cómo se rompen los lazos, ya que es fácil vincular esa discrepancia.
Joe Fitzsimons
1
Bueno, aquí está de vuelta de la estimación de envolvente ... Let es el número de veces que se recoja el conjunto S i . Esta es una variable binomial. Finge que son independientes. Ahora, para un valor fijo de Y v , puede calcular la probabilidad de obtener este valor de Y v , y para este valor calcular la probabilidad de que gane sobre todas las demás variables. Esto debería dar límites bastante buenos en la probabilidad. Por supuesto, no son los más estrictos: cuanta más dependencia esté dispuesto a tener en cuenta, más precisa será su estimación, pero más cálculos tendrá que hacer. YiSiYvYv
Sariel Har-Peled

Respuestas:

1

Si para todo i v , entoncespagv>pagyoyov

PAGr[el resultado es diferente de v]minT(PAGr[si(norte,pagv)T]+PAGr[yovsi(norte,pagyo)T]),

donde es la distribución binomial y T es un umbral arbitrario. Al conectar T = N ( p v + max i v p v ) / 2 y usar los límites de Chernoff, se puede limitar esta probabilidad como e - Ω ( N ) .si(norte,pag)TT=norte(pagv+maxyovpagv)/ /2mi-Ω(norte)

Por supuesto, si no es máximo, entonces obtienes la imagen opuesta. Con una probabilidad abrumadora v no es el resultado.pagvv

ilyaraz
fuente
1
Gracias por pensar en el problema, pero esto no es lo que estoy buscando. No es una forma cerrada. Necesitaría sumar un número ilimitado de exponenciales. Ya sé cómo escribir la solución exacta y sé muchas aproximaciones para términos individuales, pero eso no es lo que quiero. Estoy buscando una aproximación de forma cerrada a la solución, no a términos individuales. También necesito un límite decente en el error.
Joe Fitzsimons
1
Puede obtener el formulario cerrado utilizando el mismo método (si está satisfecho con el factor adicional ). Y para limitar el error, puede usar el teorema de Berry-Eseen en lugar del límite de Chernoff. norte
ilyaraz
@ilyaraz Estoy tratando de entender tu primera disecación. ¿Puedes explicarme mejor por qué aguanta? Creo que has usado union union de alguna manera, pero no puedo entender. Gracias :)
AntonioFa