Soy un novato en las estadísticas y encontré esto .
En estadística, θ, la letra griega minúscula 'theta', es el nombre usual para un (vector de) parámetro (s) de alguna distribución de probabilidad general. Un problema común es encontrar los valores de theta. Tenga en cuenta que no tiene ningún sentido nombrar un parámetro de esta manera. Bien podríamos llamarlo de otra manera. De hecho, muchas distribuciones tienen parámetros que generalmente reciben otros nombres. Por ejemplo, es de uso común nombrar la media y la desviación de la distribución normal μ (léase: 'mu') y la desviación σ ('sigma'), respectivamente.
¿Pero todavía no sé qué significa eso en inglés simple?
terminology
Kamilski81
fuente
fuente
Respuestas:
No es una convención, pero a menudo representa el conjunto de parámetros de una distribución.θ
Eso fue todo para el inglés simple, vamos a mostrar ejemplos en su lugar.
Ejemplo 1. Desea estudiar el lanzamiento de una chincheta anticuada (las que tienen un gran fondo circular). Asume que la probabilidad de que caiga es un valor desconocido al que llama . Podría llamar a una variable aleatoria X y decir que X = 1 cuando la chincheta cae hacia abajo y X = 0 cuando cae hacia arriba. Escribirías el modeloθ X X=1 X=0
y usted estaría interesado en estimar (aquí, la probabilidad de que la chincheta caiga apunta hacia abajo).θ
Ejemplo 2. Desea estudiar la desintegración de un átomo radiactivo. Según la literatura, sabe que la cantidad de radiactividad disminuye exponencialmente, por lo que decide modelar el tiempo de desintegración con una distribución exponencial. Si es el momento de la desintegración, el modelo est
Aquí es una densidad de probabilidad, lo que significa que la probabilidad de que el átomo se desintegra en el intervalo de tiempo ( t , t + d t ) es f ( t ) d t . Nuevamente, le interesará estimar θ (aquí, la tasa de desintegración).f(t) (t,t+dt) f(t)dt θ
Ejemplo 3. Desea estudiar la precisión de un instrumento de pesaje. Según la literatura, sabe que las medidas son gaussianas, por lo que decide modelar el peso de un objeto estándar de 1 kg como
Aquí es la medida dada por la escala, f ( x ) es la densidad de probabilidad, y los parámetros son μ y σ , entonces θ = ( μ , σ ) . El parámetro μ es el peso objetivo (la báscula está sesgada si μ ≠ 1 ), y σ es la desviación estándar de la medida cada vez que se pesa el objeto. Nuevamente, le interesará estimar θ (aquí, el sesgo y la imprecisión de la escala).x f(x) μ σ θ=(μ,σ) μ μ≠1 σ θ
fuente
A qué se refiere depende del modelo con el que esté trabajando. Por ejemplo, en la regresión de mínimos cuadrados ordinarios, modela una variable dependiente (generalmente llamada Y) como una combinación lineal de una o más variables independientes (generalmente llamada X), obteniendo algo comoθ
donde p es el número de variables independientes. Los parámetros que deben estimarse aquí están los , y θ es un nombre para toda la β s . Pero θ es más general, puede aplicarse a cualquier parámetro que queramos estimar.βs θ βs θ
fuente
En inglés simple:
La distribución estadística es una función matemática que le dice cuál es la probabilidad de diferentes valores de su variable aleatoria X que tiene la distribución f , es decir, f ( x ) genera una probabilidad de x . Hay diferentes tales unas funciones , pero por ahora vamos a considerar f como una especie de función "en general".f X f f(x) x f
Sin embargo, para que sea universal , es decir, uno que es posible aplicar a datos diferentes (que comparten propiedades similares), necesita parámetros que cambien su forma para que se ajusten a datos diferentes. Un ejemplo simple de dicho parámetro es μ en distribución normal que indica dónde está el centro (media) de esta distribución y, por lo tanto, puede describir variables aleatorias con diferentes valores medios. La distribución normal tiene otro parámetro σ y otras distribuciones también tienen al menos uno de esos parámetros. Los parámetros a menudo se denominan θ , donde para la distribución normal θ es una abreviatura de μ y σf μ σ θ θ μ σ (es decir, es un vector de los dos valores).
¿Por qué es importante? Las distribuciones estadísticas se utilizan para aproximar las distribuciones empíricas de datos. Supongamos que tiene un conjunto de datos de edades de un grupo de personas y, en promedio, tienen 50 años y desea aproximar la distribución de sus edades utilizando una distribución normal. Si la distribución normal no permitiera valores diferentes de μ (por ejemplo, tenía un valor fijo de este parámetro, digamos μ = 0 ), entonces sería inútil para estos datos. Sin embargo, dado que μ no es fijo, la distribución normal podría usar diferentes valores de μ , siendo μ = 50 uno de ellos. Este es un ejemplo simple, pero hay casos más complicados donde los valores deθ μ μ=0 μ μ μ=50 θ θ
fuente