¿Cuál es la diferencia entre modelo determinista y estocástico?

11

Modelo lineal simple:

ϵ t N ( 0 , σ 2 )x=αt+ϵt donde ~ iidϵtN(0,σ2)

con yV a r ( x ) = σ 2E(x)=αtVar(x)=σ2

AR (1):

ϵ t N ( 0 , σ 2 )Xt=αXt1+ϵt donde ~ iidϵtN(0,σ2)

con yV a r ( x ) = t σ 2E(x)=αtVar(x)=tσ2

Por lo tanto, un modelo lineal simple se considera un modelo determinista, mientras que un modelo AR (1) se considera un modelo estocástico.

Según un video de Youtube de Ben Lambert - Deterministic vs Stochastic , la razón de que AR (1) se llame como modelo estocástico es porque la varianza aumenta con el tiempo. Entonces, ¿la característica de la varianza no constante es el criterio para determinar el estocástico o determinista?

Tampoco creo que el modelo lineal simple sea totalmente determinista, ya que tenemos un término asociado con el modelo. Por lo tanto, siempre tenemos una aleatoriedad en . Entonces, ¿hasta qué punto podemos decir que un modelo es determinista o estocástico? xϵtx

Ken T
fuente
10
Cualquier modelo que tenga un término de error es estocástico. No tiene nada que ver con la variación que tiene que cambiar con el tiempo.
Michael R. Chernick
@MichaelChernick No entiendo. Entonces, ¿por qué la gente dice que la regresión lineal simple es un modelo determinista?
Ken T
2
¿Podría proporcionar un enlace para mostrar dónde se dice esto y por qué se dice?
Michael R. Chernick
Fue de mis notas del curso de análisis de series de tiempo hace unos años. Tal vez está mal.
Ken T

Respuestas:

12

El video habla de tendencias deterministas versus estocásticas , no de modelos . Lo más destacado es muy importante. Ambos modelos son estocásticos, sin embargo, en el modelo 1 la tendencia es determinista.

El modelo 2 no tiene tendencia. El texto de tu pregunta es incorrecto.

El modelo 2 en su pregunta es AR (1) sin una constante, mientras que en el video el modelo es una caminata aleatoria (movimiento browniano): Este modelo tiene una tendencia estocástica . Es estocástico porque es solo en promedio. Cada realización de un movimiento browniano se desviará de debido al término aleatorio , que es fácil de ver diferenciando: α t α t e t Δ x t = x t - x t - 1 = α + e t x t = x 0 + t t = 1 Δ x t = x 0 + α t + t t = 1 e

xt=α+xt1+et
αtαtet
Δxt=xtxt1=α+et
xt=x0+t=1tΔxt=x0+αt+t=1tet
Aksakal
fuente
+1. Pero para ser perfectamente claro y preciso, es posible que desee señalar que la desviación de se debe al término aleatorio , no solo . e 1 + e 2 + + e t e tαte1+e2++etet
whuber
11

Como Aksakal mencionó en su respuesta, el video que Ken T enlazó describe las propiedades de las tendencias , no de los modelos directamente, presumiblemente como parte de la enseñanza sobre el tema relacionado de la tendencia y la estacionalidad de la diferencia en la econometría. Como en su pregunta, preguntó sobre modelos, aquí está en el contexto de modelos :

Un modelo o proceso es estocástico si tiene aleatoriedad. Por ejemplo, si se le dan las mismas entradas (variables independientes, pesos / parámetros, hiperparámetros, etc.), el modelo puede producir diferentes salidas. En los modelos deterministas, la salida está completamente especificada por las entradas al modelo (variables independientes, pesos / parámetros, hiperparámetros, etc.), de modo que dadas las mismas entradas al modelo, las salidas son idénticas. El origen del término "estocástico" proviene de procesos estocásticos . Como regla general, si un modelo tiene una variable aleatoria, es estocástico. Los modelos estocásticos pueden incluso ser simples variables aleatorias independientes.

Analicemos más terminología que lo ayudará a comprender la literatura sobre modelos estadísticos (determinista, estocástico o de otro tipo ...):

Los modelos estocásticos no necesitan ser dependientes del tiempo o incluso de los procesos de Markov (dependiendo de estados pasados, por ejemplo, es Markov de primer orden ya que depende del estado en ). El modelo lineal que planteó anteriormente es estocástico (tiene una variable aleatoria) pero no Markov (no depende de estados pasados). En el modelo lineal planteado en la pregunta, el término de error es una variable aleatoria que suponemos que no está correlacionada (algunas personas van más allá al afirmar que el error es iid), distribuida simétricamente sobre la media (algunas personas van más allá al afirmar que el error es normalmente distribuido) y media cero ( ), etc. Hacemos estos supuestos para hacer que el modelo lineal sea útil para estimart - 1 μ ϵ t = 0AR(1)t1μϵt=0las variables dependientes minimizando alguna norma de ese término de error. Estos supuestos nos permiten derivar propiedades útiles de los estimadores y demostrar que ciertos estimadores son los mejores bajo esos supuestos; por ejemplo, que el estimador OLS es AZUL .

Un ejemplo más simple de un modelo estocástico es lanzar una moneda justa (cara o cruz), que puede modelarse estocásticamente como una variable aleatoria binaria distribuida uniformemente iid, o un proceso de Bernoulli . También puede considerar el lanzamiento de la moneda como un sistema físico y llegar a un modelo determinista (en un entorno idealizado) si tiene en cuenta la forma de la moneda, el ángulo y la fuerza de impacto, la distancia a la superficie, etc. El último modelo (físico) de la moneda no tiene variables aleatorias (por ejemplo, no considera el error de medición de ninguna de las entradas al modelo), entonces es determinista.

En la enseñanza de la estadística, existe un punto común de confusión entre la estocasticidad y la heterocedasticidad . Por ejemplo, Ken T ha confundido la estocasticidad con la heterocedasticidad (o la variabilidad en la varianza). Una variable aleatoria (estocástica), como la variable de salida de un proceso o en un modelo lineal , es heterocedástica si su varianza cambia sobre alguna entrada, como el tiempo ( ) en En este caso, los diferentes grupos dentro de la población tienen diferentes variaciones. En el video que Ken T enlazó (por Ben Lambert), si lo pausa a las 4:00 (4 minutos), puede ver que A R ( 1 ) ϵ t y t = a x t + ϵ t t V a r [ X t ] t V a r [ X t ]XtAR(1)ϵtyt=axt+ϵttVar[Xt]en el modelo en el lado derecho cambia con (heteroscedastic) mientras que en el modelo lineal es constante (homoscedastic).tVar[Xt]

Además, a veces hay confusión entre los procesos estocásticos estacionarios y los procesos estocásticos no estacionarios. La estacionariedad implica que estadísticas como la media o la varianza no cambian con el tiempo en el modelo. Ambos todavía se consideran modelos / procesos estocásticos siempre que haya aleatoriedad involucrada. Como su compañero Maroon, Matthew Gunn, menciona en su respuesta, la descomposición de Wold establece que cualquier proceso estocástico estacionario puede escribirse como la suma de un proceso determinista y un proceso estocástico.

hago
fuente
2
¡Gran respuesta! Una pregunta: ¿por qué escribe "... si su varianza cambia sobre algún parámetro ...", ¿no deberían ser cambios sobre alguna variable (o función de una variable)?
Alexis
1
@Alexis Me refería al tiempo como un parámetro del modelo. Tienes razón, ese lenguaje es impreciso. Fijo. Gracias. :-)
ido
¿Cómo cambia la varianza de AR (1)?
Aksakal
@Aksakal no cambia con el tiempo y es , pero para if ... ( refiere al modelo descrito como tal por Ken T.)Var[εt]σ2Var[Xt]=tσ2Xt=α+Xt1+εtεtN(0,σ2)AR(1)
ido
Solo muestra el trabajo en caso de que sea lo que estabas preguntando, Aksakal: y es constante porque es iid, o al menos no está correlacionado. Además, no hace falta decirlo, pero dado que es iid . Var[Xt]=Var[Xt1]+Var[εt]=i=1tVar[εi]=tσ2Var[εi]=σ2εtεtCov[Xt,Xt1]=0
ido
3

Algunas definiciones informales

  • Una serie temporal determinista puede escribirse como una función solo del tiempo. No hay aleatoriedad. Algunos ejemplos: {yt}
    • y(t)=2t
    • y(t)=et
  • Un proceso estocástico {Yt} es una serie de variables aleatorias. Recuerde que una variable aleatoria es una función desde un espacio muestral hasta un resultado. Un proceso estocástico es una función del tiempo y un resultado del espacio muestral . Ejemplos:ΩY(t,ω)tωΩ

    • yt=ϵt donde (es decir, sigue la distribución normal estándar)ϵtN(0,1)
    • yt=.7yt1+ϵt

    También puede pensar en un proceso estocástico como una ruta determinista para cada resultado en el espacio muestral . Dibuja aleatoriamente un y obtienes un camino .Ω ω Ω Y t ( ω )ωΩωΩYt(ω)

Algunos comentarios...

... la razón de que AR (1) se llame como modelo estocástico es porque la varianza aumenta con el tiempo.

¡Esa no es la razón! La razón por la cual un AR (1) define un proceso estocástico es porque el proceso es aleatorio. Son posibles diferentes valores en un momento , por lo tanto, el proceso es estocástico.t

Tampoco creo que el modelo lineal simple sea totalmente determinista, ya que tenemos un término asociado con el modelo.ϵt

La que ha escrito allí no es determinista. Si usted tuvo un tiempo de procesar serie donde es un proceso de ruido blanco , a continuación, la serie de tiempo podría no ser determinista. ¡Es estocástico porque hay aleatoriedad!x t = α t + ϵ t { ϵ t } { x t }xtxt=αt+ϵt{ϵt}{xt}

La serie de tiempo sería determinista. Puede descomponer en dos componentes: un componente determinista y un componente estocástico .{ x t } α t ϵ tyt=αt{xt}αtϵt

Esto lleva al Teorema de Wold de que cualquier proceso estacionario de covarianza puede descomponerse de manera única en un componente determinista y un componente estocástico.

Matthew Gunn
fuente