¿Qué significa Theta?

16

Soy un novato en las estadísticas y encontré esto .

En estadística, θ, la letra griega minúscula 'theta', es el nombre usual para un (vector de) parámetro (s) de alguna distribución de probabilidad general. Un problema común es encontrar los valores de theta. Tenga en cuenta que no tiene ningún sentido nombrar un parámetro de esta manera. Bien podríamos llamarlo de otra manera. De hecho, muchas distribuciones tienen parámetros que generalmente reciben otros nombres. Por ejemplo, es de uso común nombrar la media y la desviación de la distribución normal μ (léase: 'mu') y la desviación σ ('sigma'), respectivamente.

¿Pero todavía no sé qué significa eso en inglés simple?

Kamilski81
fuente
10
θ es solo un símbolo matemático y significa diferentes cosas en diferentes contextos. Algunas vecesθ se usa para referirse a un parámetro a estimar, pero no hay una respuesta real a la pregunta "¿Qué esθ ?". Eso es como preguntar "¿Cuál es la letra A?". Su enlace incluso sugiere esto cuando dice"Tenga en cuenta que no tiene ningún sentido nombrar un parámetro de esta manera. También podríamos llamarlo de otra manera". .
Macro
Es solo una forma de nombrar un parámetro estadístico (que define la distribución de la cantidad asociada con este 'parámetro') con una letra especial (que no sean letras en inglés).
Stat-R el
44
La mayoría de nosotros consideraría que esta cita es extremadamente simple en inglés, pero para progresar tenemos que aceptar que la pregunta no se trata de cómo leer en inglés. ¿De qué podría tratarse entonces? Sostengo que nos pide que expliquemos los términos técnicos en la cita: aquellos con los que estamos tan familiarizados que ya no vemos cuán extraños pueden ser para los no iniciados estadísticamente. Esto requiere que abordemos los significados de la distribución y los parámetros (de una distribución que es; no de una curva ajustada u otro modelo determinista).
whuber

Respuestas:

31

No es una convención, pero a menudo representa el conjunto de parámetros de una distribución.θ

Eso fue todo para el inglés simple, vamos a mostrar ejemplos en su lugar.

Ejemplo 1. Desea estudiar el lanzamiento de una chincheta anticuada (las que tienen un gran fondo circular). Asume que la probabilidad de que caiga es un valor desconocido al que llama . Podría llamar a una variable aleatoria X y decir que X = 1 cuando la chincheta cae hacia abajo y X = 0 cuando cae hacia arriba. Escribirías el modeloθXX=1X=0

P(X=1)=θP(X=0)=1θ,

y usted estaría interesado en estimar (aquí, la probabilidad de que la chincheta caiga apunta hacia abajo).θ

Ejemplo 2. Desea estudiar la desintegración de un átomo radiactivo. Según la literatura, sabe que la cantidad de radiactividad disminuye exponencialmente, por lo que decide modelar el tiempo de desintegración con una distribución exponencial. Si es el momento de la desintegración, el modelo est

f(t)=θeθt.

Aquí es una densidad de probabilidad, lo que significa que la probabilidad de que el átomo se desintegra en el intervalo de tiempo ( t , t + d t ) es f ( t ) d t . Nuevamente, le interesará estimar θ (aquí, la tasa de desintegración).f(t)(t,t+dt)f(t)dtθ

Ejemplo 3. Desea estudiar la precisión de un instrumento de pesaje. Según la literatura, sabe que las medidas son gaussianas, por lo que decide modelar el peso de un objeto estándar de 1 kg como

f(x)=1σ2πexp{(xμ2σ)2}.

Aquí es la medida dada por la escala, f ( x ) es la densidad de probabilidad, y los parámetros son μ y σ , entonces θ = ( μ , σ ) . El parámetro μ es el peso objetivo (la báscula está sesgada si μ 1 ), y σ es la desviación estándar de la medida cada vez que se pesa el objeto. Nuevamente, le interesará estimar θ (aquí, el sesgo y la imprecisión de la escala).xf(x)μσθ=(μ,σ)μμ1σθ

gui11aume
fuente
1
+1 FWIW, recientemente publiqué un ejemplo trabajado en la misma línea en stats.stackexchange.com/a/34894 . Aunque sería engañoso interpretarlo como "inglés simple" - no es tímido usar términos técnicos - hice un esfuerzo para explicar lo más clara y brevemente posible lo que está sucediendo, qué suposiciones se hacen y cómo trabaja con una familia de distribuciones parametrizadas para producir una estimación basada en datos. Para algunos, esto podría ser un complemento informativo a su respuesta aquí.
whuber
1
¡Gran respuesta! Sin embargo, estoy confundido cuando afirmas que la escala está sesgada si mu! = 1. De hecho, al "normalizar", la distribución normal estándar se convierte en x ~ N (0, 1). O, en inglés, mu = 0 y varianza = 1. Ver, por ejemplo, en.wikipedia.org/wiki/…
Mike Williamson el
Solo quiero decir que el instrumento tiene un sesgo si indica algo más que 1 kg cuando mide un objeto de 1 kg. Quizás la palabra "escala" es confusa. Aquí solo designa el instrumento.
gui11aume
3

A qué se refiere depende del modelo con el que esté trabajando. Por ejemplo, en la regresión de mínimos cuadrados ordinarios, modela una variable dependiente (generalmente llamada Y) como una combinación lineal de una o más variables independientes (generalmente llamada X), obteniendo algo comoθ

Yi=b0+b1x1+b2x2+...+bpxp

donde p es el número de variables independientes. Los parámetros que deben estimarse aquí están los , y θ es un nombre para toda la β s . Pero θ es más general, puede aplicarse a cualquier parámetro que queramos estimar.βsθβsθ

Peter Flom - Restablece a Monica
fuente
3
Pedro, aunque no lo dijo exactamente, me temo que esta respuesta puede dar un novato la impresión errónea de que el símbolo será siempre referirse a un vector de parámetros y, por el contrario, que esta es la única manera de hacer referencia a un parámetro valor. Como indica mi comentario anterior, creo que la respuesta no es más que " θ es un símbolo matemático", por lo que no es realmente una pregunta estadística. θθ
Macro
1
@Macro Creo que, en este contexto, está claro que este es el significado de que Kamilski quería. Claro, cualquier símbolo puede referirse a cualquier cosa. Pero en este párrafo, Macro significa usted, y no un curso de Economía o una parte de SAS o lo que sea. θ
Peter Flom - Restablece a Monica
1
ok, bueno, no creo que la analogía sea realmente adecuada, pero la tomaré como un intento de hipérbole. En cualquier caso, realmente me estoy refiriendo a algo muy básico que es que los novatos matemáticos a menudo confunden la notación como algo inherentemente significativo y como algo diferente de lo que es, simplemente una etiqueta. Mi punto fue que esta respuesta (creo que involuntariamente) no hace nada para disipar esa idea. Como sabe, puede referirse a otras cosas que un estadístico puede encontrar. Por ejemplo, los ángulos a menudo se denotan por θ . θθ
Macro
44
Esta explicación, aunque es clara y técnicamente correcta, no implica explícitamente ninguna distribución y, por lo tanto, no parece ser relevante para la cita en la pregunta.
whuber
1

En inglés simple:

La distribución estadística es una función matemática que le dice cuál es la probabilidad de diferentes valores de su variable aleatoria X que tiene la distribución f , es decir, f ( x ) genera una probabilidad de x . Hay diferentes tales unas funciones , pero por ahora vamos a considerar f como una especie de función "en general".f Xff(x)xf

Sin embargo, para que sea universal , es decir, uno que es posible aplicar a datos diferentes (que comparten propiedades similares), necesita parámetros que cambien su forma para que se ajusten a datos diferentes. Un ejemplo simple de dicho parámetro es μ en distribución normal que indica dónde está el centro (media) de esta distribución y, por lo tanto, puede describir variables aleatorias con diferentes valores medios. La distribución normal tiene otro parámetro σ y otras distribuciones también tienen al menos uno de esos parámetros. Los parámetros a menudo se denominan θ , donde para la distribución normal θ es una abreviatura de μ y σfμσθθμσ(es decir, es un vector de los dos valores).

¿Por qué es importante? Las distribuciones estadísticas se utilizan para aproximar las distribuciones empíricas de datos. Supongamos que tiene un conjunto de datos de edades de un grupo de personas y, en promedio, tienen 50 años y desea aproximar la distribución de sus edades utilizando una distribución normal. Si la distribución normal no permitiera valores diferentes de μ (por ejemplo, tenía un valor fijo de este parámetro, digamos μ = 0 ), entonces sería inútil para estos datos. Sin embargo, dado que μ no es fijo, la distribución normal podría usar diferentes valores de μ , siendo μ = 50 uno de ellos. Este es un ejemplo simple, pero hay casos más complicados donde los valores deθμμ=0μμμ=50θθ

θ

Tim
fuente