Estoy tratando de generar conjuntos de variables aleatorias causalmente conectadas y comencé a hacer esto con un enfoque de Monte Carlo.
La línea de base es un histograma medido bidimensional del que extraigo valores aleatorios.
En mis ejemplos concretos, estas variables son la aceleración y velocidad - obviamente tiene que aguantar.
Mi enfoque ingenuo actual es:
Empiezo con un poco . Entonces genero un azar de acuerdo con la probabilidad medida de por el valor de . Usando esto Puedo calcular y todo el procedimiento comienza de nuevo.
Entonces cuando reviso las aceleraciones generadas en contenedores de todo está bien. Pero obviamente esto no respeta en absoluto la distribución marginal de.
Estoy un poco familiarizado con los métodos básicos de Monte Carlo, aunque carece de algunos antecedentes teóricos, como puede suponer. Estaría bien si las dos variables en las que simplemente conectados por alguna matriz de correlación, pero la conexión causal entre los dos me da dolores de cabeza.
No pude encontrar un ejemplo para este tipo de problema en alguna parte, podría estar buscando los términos incorrectos. Estaría satisfecho si alguien pudiera señalarme algún tipo de literatura / ejemplo o un método prometedor para conseguir esto.
(O dígame que eso no es realmente posible debido a mis aportes, eso es lo que supongo ocasionalmente ...)
EDITAR:
El objetivo real de todo este procedimiento: tengo un conjunto de medidas y , representado en un histograma bidimensional . Dada esta entrada, me gustaría generar conjuntos de aleatorios y que reproducen la distribución medida.
fuente
Respuestas:
Parece que para reproducir la distribución conjuntaρ ( a , v ) , debes seleccionar nuevo una no solo basado en v , pero basado en el viejo una además:
La pregunta (para la cual aún no sé la respuesta) es cómo encontrarρ′ que produce ρ .
UPD: debe resolver la siguiente ecuación integral:
Aproximando la funciónρ con un histograma, conviertes esto en un sistema de ecuaciones lineales:
Este sistema está subdeterminado. Puede aplicar una penalización por suavidad para obtener una solución.
fuente
¿Los datos GPS no contienen posición?p ? Hubiera pensado que, no solo esvi+1 depende de vi y ai pero ai+1 también dependería de pi . Considere: en cualquier red de carreteras hay cuellos de botella, límites de velocidad, señales, intersecciones, pendientes pronunciadas, etc. que están geolocalizados. Entonces, algo así como un conjunto (distribución) definido por:
Para tal conjunto, la dificultad radicará en la naturaleza de los datos. Es probable que la verdadera población sea asimétrica, no lineal (por partes) y no tenga momentos definidos. Estas características pueden no ser evidentes dentro de la muestra que tiene a mano.
Como ha dicho @whuber, el problema, es decir, exactamente lo que está buscando producir, todavía no parece estar completamente y claramente definido. No está claro si está interesado en el conjunto o más en los individuos.
fuente