¿Cómo reformulo estadísticamente esta pregunta?

8

Estoy analizando un conjunto de datos que contiene observaciones de n número de intentos de jugadores en un juego. Si estoy construyendo un modelo de regresión para predecir el resultado de cada intento dado 1 o más descriptores con respecto al intento de cada jugador , ¿cómo mido cuántos intentos debe tener un jugador antes de que cualquier descriptor particular se vuelva "significativo" o "significativo" dado nuestro conjunto de datos ?

Un buen ejemplo sería un grupo de personas jugando a los dardos. Un novato absoluto podría cerrar los ojos, lanzar el dardo y dar en el blanco. Obviamente, sabemos que fue pura casualidad, nunca había jugado antes, y diablos, incluso podría estar intoxicado. Pero digamos que lanza 5 dardos más y da en el blanco 3 veces más de esos 5. Ahora ha lanzado 6 dardos y da en el blanco el 50% del tiempo. Ahora las cosas se están volviendo sospechosas ...

¿En qué punto este verdadero novato lanza suficientes dardos de tiro al blanco, y cuántos intentos necesita antes de que podamos decir que tiene un talento serio por encima de otros jugadores más experimentados? ¿Cuál es este término en estadísticas y dónde puedo obtener más información al respecto?

Descargo de responsabilidad: Traté de evitar el uso de términos estadísticos cargados como "importancia" y "observaciones" tanto como sea posible, aunque sentí que eran apropiados en ciertos lugares aquí.

Si alguien puede señalarme en la dirección correcta, sería fantástico. ¡¡Gracias!!

KidMcC
fuente
2
Estás a solo unos pasos de convertirte en Bayesiano ...
Marcelo Ventura
Entonces, ¿se trata de intervalos de confianza a medida que se lanzan más dardos, hasta cierto punto?
KidMcC
Lo que estás viendo podría ser una prueba secuencial. O bien, es posible que desee calcular el poder estadístico, es decir, cuántas muestras necesita extraer para reducir el error beta; observe que cuando mira a un jugador determinado, las muestras no son independientes. Todo esto también podría integrarse naturalmente en un marco bayesiano, como dijo el primer comentarista.
Regenschein
Adaptativo y secuencial son dos palabras clave útiles.
whuber

Respuestas:

1

Darts es el más simple de los juegos. Cada jugador comienza con una puntuación de 501 y se turna para lanzar 3 dardos. La puntuación para cada turno se calcula y se deduce del total de jugadores. Bullseye puntúa 50, el anillo exterior puntúa 25 y un dardo en el anillo doble o triple cuenta el puntaje del segmento doble o triple.

Imagen de http://www.shotdarts.com/darts-info/play-darts

Ahora las probabilidades se han examinado en otro lugar . En ese sitio, se nos dice "Un jugador de dardos de habilidad media tendrá una desviación estándar más grande; aunque los disparos pueden, en promedio, centrarse en el mismo objetivo, se distribuirán en una región más amplia. Un jugador de dardos pobre tendrá tienen una desviación estándar alta y sus disparos serán, probabilísticamente, dispersos en una región mucho más amplia ". Es decir, puntajes de dardos.

Por lo tanto, para responder la pregunta, hacemos lo que siempre hacemos. Construimos un histograma de puntajes, y para el juego en sí podríamos usar el puntaje 501, y luego ajustamos una función de densidad, y luego probamos esa función de densidad contra las funciones de densidad de otros jugadores. Por lo tanto, necesitamos suficientes datos para que nuestra ubicación y su desviación tengan suficiente poder predictivo para discriminar adecuadamente entre los jugadores. Cuantos menos datos, más difusas son las respuestas, y no hay un número mágico para ellas, cuanto más mejor.

Carl
fuente