distribución del dedo gordo

10

Breve pregunta:
¿Hay una distribución de dedos gordos? Estoy seguro de que si existe, entonces tiene un nombre diferente.

No sé cómo formularlo como una función analítica. ¿Me pueden ayudar a encontrar una versión existente o comenzar a formularla en algo más limpio que una simulación gigante?

Es la distribución de los números realmente presionados cuando un número dado es el objetivo deseado, pero los botones son mucho más pequeños que el dedo, por lo que los botones cercanos a veces son los que se golpean por accidente.

El uso de una distribución como esta son entradas falsas al presionar botones en un teléfono celular. Si operara una empresa en la que uno tuviera que "presionar 1 ahora" o algo así y "usted presionó 1, es correcto", entonces podrían obtener una aproximación decente de las probabilidades de dedos gordos, aunque 2 dedos seguidos podrían estropearlo arriba algunos. (¿Distancia de Hamming en dedos gordos? ¿Cadenas Markov de dedos gordos?)

Quiero usarlo para tratar de construir la corrección de errores al presionar las teclas. Tengo algunas muestras propias, pero no hay suficiente variación en la "gordura" de los dedos o la topología del teclado del teléfono celular para ser robusto.

Antecedentes y elaboración:
Aquí hay una distribución normal del teclado del teléfono celular: ingrese la descripción de la imagen aquí

Imagine que mis dedos son mucho más grandes que las teclas, por lo que cuando voy a golpear un 5, es muy probable que obtenga un 5, pero también es probable que obtenga un 2,4,6 u 8 (igualmente probable ) y luego soy menos probable (pero no cero) para obtener un 1,3,7,9 (igualmente probable) y es muy poco probable que obtenga un 0.

Puedo imaginar que si intentara escribir un número infinito de 5 para un "diámetro de dedo" fijo, obtendría una distribución de valores. Si el valor de mi dedo es menor, entonces la distribución cambia. Si intento obtener un número diferente, la distribución cambia.

En la práctica, esto dependerá del diseño de las claves. Si estuvieran en un anillo gigante y no en una cuadrícula de 3x3, entonces sería un tipo diferente de pregunta. En este caso, espero que solo tratemos con cuadrículas rectangulares de 3x3. También sospecho que el teclado tiene un pestillo digital para que solo se pueda detectar una pulsación de tecla. Habrá como máximo 7 frecuencias para otros botones, como cuando se presiona el "0". No estoy seguro de una manera limpia de comprometer eso. ¿Quizás un factor multiplicado por la distancia al cuadrado normalizada entre la tecla objetivo y la tecla activada candidata?

Así es como simularía la distribución para cuando se presiona el cinco (los pesos son algo arbitrarios):

#number of presses
npress <- 1000

#hack this (not quadratic)
myprobs <- c(0.85)
myprobs <- c(myprobs, 0.1275/4, 0.1275/4, 0.1275/4, 0.1275/4)
myprobs <- c(myprobs, 0.019125/4, 0.019125/4, 0.019125/4, 0.019125/4)
myprobs <- c(myprobs,1-sum(myprobs) )

#order of number 
my_button <- c(5,2,4,6,8,1,3,7,9,0)

#declare before loop
y <- numeric()

#sample many button presses
for (i in 1:npress){

     #press the button, store the result 
     y[i] <- sample(my_button,size=1,prob=myprobs)

}

#hist, show counts
hist((y),freq = T)
grid()

#hist, show freq
hist((y),freq = F)
grid()

#declare before loop
my_p5 <- numeric()

# compute the probabilties
for (i in 1:length(my_button)){

     my_p5[i] <- length(which(y==my_button[i]))/npress
}

# show probability values
print(data.frame(my_button,my_p5))

nota adicional:
Entonces leí este artículo:
http://www.scientificamerican.com/article/peculiar-pattern-found-in-random-prime-numbers/

Supongo que hay una inversa de la variación de "distribución de dedos gordos" que se aplica al último dígito de los números primos. Hay dígitos que se excluyen en función del último dígito del número primo.

Estudiante
fuente

Respuestas:

4

Como estamos tratando con números discretos, inmediatamente pensé en usar una Distribución categórica como la distribución condicional de cada tecla de destino.

Entonces, si tomamos su ejemplo de la intención de un usuario de presionar 5, y dejamos que sea ​​la tecla presionada, entonces obtenemos:K

P(K=k|5)=pk,5wherepk,50andk=09pk,5=1

Podemos definir dicha distribución para cada clave. Esta es la parte empírica.

Ahora, digamos que el número realmente presionado es , queremos inferir la intención llave . Esto se expresa naturalmente como un problema de inferencia bayesiana:kI

P(I=i|k)=P(I=i)P(k|I=i)i=09P(I=i)P(k|I=i)

Esta ecuación le indica la probabilidad de que el usuario pretendiera presionar dado que presionó .i k

Sin embargo, notará que esto depende de , que es la probabilidad previa de que alguien tenga la intención de presionar . Me imagino que esto estaría condicionado a que se presione el número de teléfono real (por supuesto), pero como no lo sabrá, necesitará alguna forma de ajustar este contexto anterior.P(I=i)i

La conclusión es que no hay una distribución única de dedo gordo, a menos que estemos hablando de la distribución condicional en un número deseado. Si su método de corrección de errores es útil, tendrá que adivinar el número deseado utilizando estas distribuciones condicionales. Sin embargo, esto requerirá algún contexto previo útil, de lo contrario, esperaría que la tecla inferida sea siempre la tecla presionada ... no demasiado útil.


fuente
0

Estoy de acuerdo con el enfoque de Bey, es decir, la probabilidad condicional para cada tecla que se presionará dada la intención del usuario es más alta para la tecla deseada. Si no fuera así, los fabricantes de equipos cambiarían el nombre de la clave. Algunas teclas son más propensas a presionarse mal que otras. Quizás hacia el medio. Incluso sabiendo esto, porque estamos ingresando números, no es posible explotar como corregir palabras ya que un número es tan válido como el siguiente. Por lo tanto, la corrección de errores en pulsaciones de teclas individuales no es factible.

Lo que es factible es corregir, o quizás la detección menos ambiciosa de errores clave en un tipo de datos de entrada dado. Esto se hace para un ISBN o un número de tarjeta de crédito, por ejemplo. Sin embargo, los números de teléfono no tienen sumas de cheques. Quizás la distribución empírica para cada teclado podría usarse para hacer la verificación de números más eficiente, siendo ese el mejor uso de los números de verificación agregados.

Ben S
fuente
Si tuviera el control, podría hacer tamaños de botones y distancias entre centros en el controlador geométrico de corrección de errores. Quizás con la misma área para trabajar con uno podría hacer una mejor corrección. Con la llegada de los teléfonos inteligentes (er), uno podría tener teclas redimensionadas dinámicamente y un toque constante para ayudar a informar las intenciones.
EngrStudent