¿Qué hace exactamente una caminata aleatoria?

8

Para ser honesto, he leído muchos sitios web y respuestas con respecto a esta pregunta, y ninguno lo explicó en palabras simples que sean comprensibles. Lo que quiero hacer es comprender qué hace una caminata aleatoria y cómo se puede usar para el Análisis de enriquecimiento de conjuntos de genes.

Hay un artículo publicado aquí http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3205944/ sin embargo, realmente no pude entenderlo.

¿Alguien puede explicar lo que hace en palabras simples?

Aprendiz
fuente
2
¡Esas son dos preguntas muy diferentes!
Alexis
1
@Alexis Acepté tu revisión, ¡espero que ahora esté claro!
Estudiante
1
@Nemo Eliminé etiquetas no relacionadas y agregué etiquetas de series temporales . Siéntase libre de editar mis cambios o agregar etiquetas adicionales, pero las etiquetas como r , significación estadística o matemáticas no parecen estar relacionadas aquí.
Tim

Respuestas:

11

Voy a tratar de responder tu primera pregunta

Una caminata aleatoria es una serie de mediciones en las que el valor en cualquier punto dado de la serie es el valor del punto anterior de la serie más alguna cantidad aleatoria.

Por ejemplo, suponga que lanza una moneda justa en una serie de lanzamientos, y cada vez que la moneda sale cara agrega 1 al valor anterior de su variable en serie, y cada vez que la moneda sale cruz, resta 1 del valor anterior de su variable en serie. Si el valor inicial es 0, y si voltea la siguiente secuencia de lanzamiento de monedas:

T H T T T H H H T T H T H T H

El camino al azar ,y basado en estos valores como se describe anteriormente sería:

0 -1 0 -1 -2 -3 -2 -3 -1 -2 -2 -1 -2 -1 -2 -1

Entonces el valor de y es:

yt=yt1+2Bernoulli(0.5)1

La distribución de depende del tiempo , dando algunas propiedades interesantes a una muestra de en diferentes tiempos:yty

  1. La media de no está definida. yEsto puede parecer contrario a la intuición, ya que es de esperar que las caras y las colas de una moneda equilibrada estén centradas en cero. Esto es cierto hasta donde llega, pero cero era solo un valor inicial arbitrario de . y¡Entonces no hay un medio real!

  2. La varianza de . y=tA medida que aumenta el tiempo (el número de vueltas), la variación también aumenta. Por ejemplo, en la primera vuelta ( ), los valores posibles son o , y de hecho la varianza es 1. Pero en la segunda vuelta ( ) los valores posibles son , o , y la varianza es igual a 2. Para un número infinito de vueltas (en , cuando el rango de todos los valores posibles de va de a ), la varianza es infinita.t=111t=2202t=y

Estos dos hechos causan estragos al tratar de hacer inferencias sobre la distribución de (en lugar de para un dado) dado solo una muestra cuando se utilizan las herramientas básicas de inferencia estadística. (¿Cómo puede un finito estimar indefinido ? ¿Cómo puede un finito estimar ?)yyty0y¯sy2σy2=

Hay muchos tipos de caminata aleatoria, y más generalmente, de proceso autogregresivo (es decir, cualquier variable que depende de alguna manera de sus valores anteriores). El ejemplo aquí usa una variable aleatoria simple de Bernouli (el lanzamiento de la moneda), pero uno podría:

  • agregue un valor aleatorio normalmente distribuido a valores sucesivos de lugar ... o, de hecho, un valor aleatorio extraído de cualquier tipo de distribución;y
  • hacer que el valor de en algún momento dependa de los valores anteriores de de más de un punto en el tiempo (por ejemplo, );yyyt=yt1+yt2+Something Random
  • empareje el valor de con un valor aleatorio de para crear una caminata aleatoria bidimensional;yx
  • haga que una función elegante de , un ejemplo simple es , donde , lo que significa que la memoria de cualquier momento específico de decae con el tiempo (con una memoria que dura más cuanto más se acerca a 1) —por los comentarios de Alecos, esto sería simplemente “autorregresivo” (una caminata aleatoria pura tendría );ytyt1yt=αyt1+Something Random|α|<1y |α||α|=1
  • hacer muchas otras cosas para hacer que las caminatas aleatorias y / o los procesos autorregresivos sean más complejos.

Pero son todos los Dickens para tratar de analizar utilizando los métodos básicos. Es por eso que tenemos regresiones cointegradoras y modelos de corrección de errores y otras técnicas de análisis de series temporales para tratar con este tipo de datos (a los que a veces nos referimos como 'no integrados', 'memorizados por largo tiempo' o 'raíz unitaria' entre otras etiquetas , dependiendo de los detalles).

El origen del término "caminata aleatoria" es de un par de cartas muy breves a la naturaleza en 1905.

Referencias
Pearson, K. (1905). Cartas al editor: el problema de la caminata aleatoria. Nature , 72 (1865): 294.

Pearson, K. (1905). Cartas al editor: el problema de la caminata aleatoria. Nature , 72 (1867): 342.

Alexis
fuente
2
Escribe "Una caminata aleatoria es una serie de mediciones en las que el valor en cualquier punto de la serie depende de los valores de los puntos anteriores de la serie". Pero esto describe cualquier proceso autorregresivo, y no todos los procesos autorregresivos son caminatas aleatorias. Como obviamente conoce el tema, creo que sería útil si revisara esta afirmación para sacar a la superficie cuáles son las características únicas de una caminata aleatoria.
Alecos Papadopoulos
@AlecosPapadopoulos TY! Por favor, ayúdame aquí ... en realidad no tengo una profunda familiaridad con el tema. ¿Cómo sugeriría que diferencie las caminatas aleatorias de los procesos autorregresivos?
Alexis
Con alegría. Existe una gran literatura sobre caminatas aleatorias, el tema es muy diverso. Pero en el primer nivel, lo que distingue una caminata aleatoria es que todos los valores pasados ​​de cada paso contribuyen con su valor total al valor actual de su suma (que es la caminata aleatoria). En un proceso autorregresivo, generalmente el efecto del pasado gradualmente se extingue. Usted esencialmente discute esto en su publicación. Además, ahora vuelvo a leer su respuesta, tal vez quiera repensar el uso de la palabra "población": cada tiene una distribución diferente, entonces, ¿en qué sentido pertenece a la misma población? ytyt,yt+1...
Alecos Papadopoulos
1
@Nemo Obtiene un tipo específico de comportamiento (generalmente a lo largo del tiempo): el pasado determina completamente dónde se encuentra, pero el camino de la evolución no afecta a dónde será el próximo. Cómo llegó el proceso a su posición actual, no importa para el futuro.
Alecos Papadopoulos
1
Una caminata aleatoria realmente no es "similar a una prueba de Kolmogorov-Smirnov". Una derivación de la distribución asintótica del estadístico de prueba KS bajo la hipótesis nula utiliza una noción relacionada con una caminata aleatoria. El punto de dibujar esa conexión parece, desde mi rápido vistazo, ser motivar el desarrollo en la siguiente sección (la prueba GSEA). No estoy seguro de que haya sido una buena elección; parece que te ha llevado a la confusión en lugar de ayudarte a ver lo que estaba sucediendo. Le sugiero que intente comprender las caminatas aleatorias por separado antes de intentar comprender la conexión entre las caminatas aleatorias y GSEA.
Glen_b -Reinstate Monica