Resuelvo los cubos de Rubik como un hobby. Grabo el tiempo que me llevó resolver el cubo usando algún software, y ahora tengo datos de miles de soluciones. Los datos son básicamente una larga lista de números que representan el tiempo que tomó cada resolución secuencial (por ejemplo, 22.11, 20.66, 21.00, 18.74, ...)
El tiempo que me lleva resolver el cubo, naturalmente, varía un poco de una solución a otra, por lo que hay buenas soluciones y malas soluciones.
Quiero saber si me "pongo caliente", si las buenas soluciones vienen en rayas. Por ejemplo, si acabo de tener algunas buenas soluciones consecutivas, ¿es más probable que mi próxima solución sea buena?
¿Qué tipo de análisis sería apropiado? Puedo pensar en algunas cosas específicas que hacer, por ejemplo, tratar las soluciones como un proceso de Markov y ver qué tan bien se resuelve una predicción de la siguiente y comparar con datos aleatorios, ver cuánto duran las rachas más largas de soluciones consecutivas por debajo de la mediana para la última 100 son y en comparación con lo que se esperaría en datos aleatorios, etc. No estoy seguro de cuán perspicaces serían estas pruebas, y me pregunto si hay algunos enfoques bien desarrollados para este tipo de problema.
fuente
Algunas reflexiones:
Trazar la distribución de los tiempos. Supongo que estarán sesgados positivamente, de modo que algunos tiempos de solución son realmente lentos. En ese caso, es posible que desee considerar un registro o alguna otra transformación de los tiempos de solución.
Cree un diagrama de dispersión de prueba en el eje xy el tiempo de solución (o registre el tiempo de solución en el eje y). Esto debería darle una comprensión intuitiva de los datos. También puede revelar otros tipos de tendencias además de la "buena racha".
Considere si hay un efecto de aprendizaje con el tiempo. Con la mayoría de los rompecabezas, te vuelves más rápido con la práctica. La trama debería ayudar a revelar si este es el caso. Tal efecto es diferente a un efecto de "racha activa". Conducirá a una correlación entre las pruebas porque cuando está aprendiendo por primera vez, las pruebas lentas coexistirán con otras pruebas lentas y, a medida que tenga más experiencia, las pruebas más rápidas ocurrirán con pruebas más rápidas.
Considere su definición conceptual de "rayas calientes". Por ejemplo, solo se aplica a los ensayos que se aproximan en el tiempo o se trata de la proximidad del orden. Digamos que resolvió el cubo rápidamente el martes, y luego tuvo un descanso y el próximo viernes lo resolvió rápidamente. ¿Es una buena racha, o solo cuenta si lo haces el mismo día?
¿Hay otros efectos que podrían ser distintos de un efecto de racha activa? Por ejemplo, la hora del día en que resuelve el rompecabezas (por ejemplo, fatiga), ¿hasta qué punto se está esforzando realmente? etc.
Una vez que se han entendido los efectos sistemáticos alternativos, puede desarrollar un modelo que incluya tantos como sea posible. Puede trazar el residuo en el eje y y probar en el eje x. Entonces podría ver si hay correlaciones automáticas en los residuos del modelo. Esta autocorrelación proporcionaría alguna evidencia de rayas calientes. Sin embargo, una interpretación alternativa es que hay algún otro efecto sistemático que no ha excluido.
fuente
Calcule el correlograma para su proceso. Si su proceso es gaussiano (por el aspecto de su muestra lo es) puede establecer límites inferior / superior (B) y verificar si las correlaciones en el retraso dado son significativas. La autocorrelación positiva en el retraso 1 indicaría la existencia de "vetas de suerte".
fuente