Estoy analizando un conjunto de datos que contiene observaciones de n número de intentos de jugadores en un juego. Si estoy construyendo un modelo de regresión para predecir el resultado de cada intento dado 1 o más descriptores con respecto al intento de cada jugador , ¿cómo mido cuántos intentos debe tener un jugador antes de que cualquier descriptor particular se vuelva "significativo" o "significativo" dado nuestro conjunto de datos ?
Un buen ejemplo sería un grupo de personas jugando a los dardos. Un novato absoluto podría cerrar los ojos, lanzar el dardo y dar en el blanco. Obviamente, sabemos que fue pura casualidad, nunca había jugado antes, y diablos, incluso podría estar intoxicado. Pero digamos que lanza 5 dardos más y da en el blanco 3 veces más de esos 5. Ahora ha lanzado 6 dardos y da en el blanco el 50% del tiempo. Ahora las cosas se están volviendo sospechosas ...
¿En qué punto este verdadero novato lanza suficientes dardos de tiro al blanco, y cuántos intentos necesita antes de que podamos decir que tiene un talento serio por encima de otros jugadores más experimentados? ¿Cuál es este término en estadísticas y dónde puedo obtener más información al respecto?
Descargo de responsabilidad: Traté de evitar el uso de términos estadísticos cargados como "importancia" y "observaciones" tanto como sea posible, aunque sentí que eran apropiados en ciertos lugares aquí.
Si alguien puede señalarme en la dirección correcta, sería fantástico. ¡¡Gracias!!
Respuestas:
Darts es el más simple de los juegos. Cada jugador comienza con una puntuación de 501 y se turna para lanzar 3 dardos. La puntuación para cada turno se calcula y se deduce del total de jugadores. Bullseye puntúa 50, el anillo exterior puntúa 25 y un dardo en el anillo doble o triple cuenta el puntaje del segmento doble o triple.
Imagen de
Ahora las probabilidades se han examinado en otro lugar . En ese sitio, se nos dice "Un jugador de dardos de habilidad media tendrá una desviación estándar más grande; aunque los disparos pueden, en promedio, centrarse en el mismo objetivo, se distribuirán en una región más amplia. Un jugador de dardos pobre tendrá tienen una desviación estándar alta y sus disparos serán, probabilísticamente, dispersos en una región mucho más amplia ". Es decir, .
Por lo tanto, para responder la pregunta, hacemos lo que siempre hacemos. Construimos un histograma de puntajes, y para el juego en sí podríamos usar el puntaje 501, y luego ajustamos una función de densidad, y luego probamos esa función de densidad contra las funciones de densidad de otros jugadores. Por lo tanto, necesitamos suficientes datos para que nuestra ubicación y su desviación tengan suficiente poder predictivo para discriminar adecuadamente entre los jugadores. Cuantos menos datos, más difusas son las respuestas, y no hay un número mágico para ellas, cuanto más mejor.
fuente