Pruebe si las personas abandonan o disminuyen las apuestas después de pérdidas repetidas

10

Tengo datos sobre una serie de apuestas ganadoras y perdedoras en 5 rondas de apuestas con deserción después de cada ronda. Estoy usando un árbol de decisión como el siguiente para mostrar los datos.

ingrese la descripción de la imagen aquí

Los nodos hacia la parte superior del árbol son aquellos que están teniendo apuestas ganadoras, y aquellos hacia la parte inferior del árbol están teniendo carreras de apuestas perdedoras. Quiero ver (a) la deserción en cada nodo (b) los cambios en los tamaños medios de apuesta en cada nodo. Estoy mirando la tasa de deserción en cada nodo del nodo anterior y la tasa de supervivencia (usando la cantidad esperada de personas en cada nodo si la probabilidad es del 50%). Por ejemplo, si la probabilidad es del 50% en cada nodo, de los 1000 que comenzaron, aproximadamente 500 personas deberían estar en cada uno de los segundos nodos, W y L. La hipótesis es (a) la tasa de desgaste es mayor después de perder apuestas (b) el tamaño medio de la apuesta se reduce después de los perdedores y aumenta después de los ganadores.

Solo quiero hacer esto en un entorno univariado muy simple primero. ¿Cómo puedo realizar una prueba t para mostrar que el cambio en el tamaño medio de la apuesta del nodo WW al nodo WWW es estadísticamente significativo si 50 personas se han retirado? No estoy seguro de que este sea el enfoque correcto: cada apuesta posterior es independiente, pero la gente abandona a los perdedores, por lo que la muestra no coincide. Si se tratara de un caso de la misma clase tomando una serie de exámenes uno tras otro sin que nadie abandone, entendería cómo realizar la prueba t adecuada, pero creo que esto es un poco diferente.

¿Cómo puedo hacer esto? Además, si los resultados están siendo sesgados por un pequeño número de clientes, ¿cómo podría eliminar el 5% superior y el 5% inferior? ¿Solo elimina a los clientes con el mayor tamaño de apuesta acumulada de la apuesta 1 - 3?

Tengo los datos a partir de los cuales se generó la figura, por lo que tengo el error medio, estándar, estándar, etc. en cada nodo.

usuario2146441
fuente
1
La línea que debería ser WL se etiqueta WW. El error se propaga por esa línea. ¿Es que todo lo que tiene es esta figura o tiene los datos a partir de los cuales se generó la figura?
John
Estoy tratando de averiguar si es posible saber a partir de esto dónde ocurre el desgaste. La N son las personas que hicieron una apuesta, pero no las personas que realmente llegaron allí. Por ejemplo, 450 van W, pero lo que sale es 250 y 180. Entonces, 20 se fueron pero ¿ganaron o perdieron esos?
John
Tengo los datos a partir de los cuales se generó la figura, sí. Desde entonces edité el árbol para corregir el error que señaló y cambié parte del nodo final para replicar el tipo de desgaste en el conjunto de datos real. Tienes razón en que el desgaste no está claro en este momento. Editaré el árbol nuevamente en los próximos minutos para mostrar un poco más de datos. Gracias.
user2146441

Respuestas:

1

Casi parece "obvio al mirar" que los perdedores eran más propensos a abandonar que los ganadores.

Puede probar un conjunto de tablas de contingencia para establecer si lo anterior es estadísticamente significativo. Por ejemplo, de los 450 ganadores de la primera apuesta, 25 abandonaron y 425 se quedaron y de los 550 perdedores, 150 abandonaron y 400 se quedaron. Etc.

Emil Friedman
fuente
0

Esta respuesta probablemente estará un poco fuera del tema, pero comenzaré con lo que está en el tema. Si me pidieran específicamente que determinara si el cambio en el tamaño medio de la apuesta de WW a WWW fue significativo, ignoraría a las personas que no alcanzaron ambos nodos. Si el objetivo de este análisis es poder hacer predicciones para el comportamiento futuro, entonces la mecánica de la prueba debería hacer bien en emular la mecánica del comportamiento futuro, incluso si el juego no es un juego de azar. ¿Cuál es el punto de medir cómo la apuesta de alguien cambiaría de WW a WWW si no fuera el tipo de persona que pasaría de WW a WWW?

Dicho esto, en general obviamente no nos gusta excluir sistemáticamente ciertas poblaciones. Si me dieran estos datos, me concentraría en los tipos de análisis más factibles. Lo más notable (especialmente si este no es un juego de azar) los jugadores en un nodo similar tienen mucho en común. Han tenido la misma secuencia de (W, L) y no les queda. Contestar preguntas en la línea de "¿Cuál es el efecto de perder una ronda de donaciones en el tamaño de la apuesta y el desgaste?" Es bastante factible mientras se controla el comportamiento dependiente del nodo, en forma de un modelo de varios niveles.

Un último consejo sería centrarse en las diferencias de nivel de jugador de ronda en ronda. La apuesta media que baja 5 centavos después de un poco puede ser estadísticamente insignificante, mientras que el 90% de las apuestas de los jugadores que bajan probablemente lo serán.

jlimahaverford
fuente