Para ser honesto, he leído muchos sitios web y respuestas con respecto a esta pregunta, y ninguno lo explicó en palabras simples que sean comprensibles. Lo que quiero hacer es comprender qué hace una caminata aleatoria y cómo se puede usar para el Análisis de enriquecimiento de conjuntos de genes.
Hay un artículo publicado aquí http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3205944/ sin embargo, realmente no pude entenderlo.
¿Alguien puede explicar lo que hace en palabras simples?
time-series
biostatistics
bioinformatics
Aprendiz
fuente
fuente
Respuestas:
Voy a tratar de responder tu primera pregunta
Una caminata aleatoria es una serie de mediciones en las que el valor en cualquier punto dado de la serie es el valor del punto anterior de la serie más alguna cantidad aleatoria.
Por ejemplo, suponga que lanza una moneda justa en una serie de lanzamientos, y cada vez que la moneda sale cara agrega 1 al valor anterior de su variable en serie, y cada vez que la moneda sale cruz, resta 1 del valor anterior de su variable en serie. Si el valor inicial es 0, y si voltea la siguiente secuencia de lanzamiento de monedas:
El camino al azar ,y basado en estos valores como se describe anteriormente sería:
Entonces el valor dey es:
La distribución de depende del tiempo , dando algunas propiedades interesantes a una muestra de en diferentes tiempos:y t y
La media de no está definida.y Esto puede parecer contrario a la intuición, ya que es de esperar que las caras y las colas de una moneda equilibrada estén centradas en cero. Esto es cierto hasta donde llega, pero cero era solo un valor inicial arbitrario de . y ¡Entonces no hay un medio real!
La varianza de .y=t A medida que aumenta el tiempo (el número de vueltas), la variación también aumenta. Por ejemplo, en la primera vuelta ( ), los valores posibles son o , y de hecho la varianza es 1. Pero en la segunda vuelta ( ) los valores posibles son , o , y la varianza es igual a 2. Para un número infinito de vueltas (en , cuando el rango de todos los valores posibles de va de a ), la varianza es infinita.t=1 1 −1 t=2 2 0 −2 t=∞ y −∞ ∞
Estos dos hechos causan estragos al tratar de hacer inferencias sobre la distribución de (en lugar de para un dado) dado solo una muestra cuando se utilizan las herramientas básicas de inferencia estadística. (¿Cómo puede un finito estimar indefinido ? ¿Cómo puede un finito estimar ?)y yt y0 y¯ s2y σ2y=∞
Hay muchos tipos de caminata aleatoria, y más generalmente, de proceso autogregresivo (es decir, cualquier variable que depende de alguna manera de sus valores anteriores). El ejemplo aquí usa una variable aleatoria simple de Bernouli (el lanzamiento de la moneda), pero uno podría:
Pero son todos los Dickens para tratar de analizar utilizando los métodos básicos. Es por eso que tenemos regresiones cointegradoras y modelos de corrección de errores y otras técnicas de análisis de series temporales para tratar con este tipo de datos (a los que a veces nos referimos como 'no integrados', 'memorizados por largo tiempo' o 'raíz unitaria' entre otras etiquetas , dependiendo de los detalles).
El origen del término "caminata aleatoria" es de un par de cartas muy breves a la naturaleza en 1905.
Referencias
Pearson, K. (1905). Cartas al editor: el problema de la caminata aleatoria. Nature , 72 (1865): 294.
Pearson, K. (1905). Cartas al editor: el problema de la caminata aleatoria. Nature , 72 (1867): 342.
fuente