Aprendí que una estadística es un atributo que puede obtener de las muestras. Tomando muchas muestras del mismo tamaño, calculando este atributo para todas ellas y trazando el pdf, obtenemos la distribución del atributo correspondiente o la distribución de las estadísticas correspondientes.
También escuché que las estadísticas están hechas para ser estimadores, ¿cómo difieren estos dos conceptos?
Respuestas:
Definición
De Wikipedia:
Y
La diferencia importante es:
(Para saber qué significa "Cantidad", consulte la sección a continuación).
Una estadística no es un estimador
Un estimador es una estadística con algo agregado. Para convertir una estadística en un estimador, simplemente especifique qué cantidad objetivo desea estimar. Esto es confuso, porque no agrega nada "real" a la estadística, pero solo algunos intentan hacerlo.
Para ver que la diferencia es importante, debe darse cuenta de que no puede calcular las propiedades de un estimador (por ejemplo , sesgo , varianza , etc.) para una mera estadística. Para calcular el sesgo , debe encontrar la diferencia entre el valor que le da su estadística y el valor verdadero. Solo un estimador viene con un "valor verdadero" que permite calcular un sesgo. Una estadística es simplemente una función de los datos, y no es correcta ni incorrecta.
Diferentes estimadores basados en la misma estadística
Puede deletrear diferentes cantidades objetivo para la misma estadística, lo que resulta en diferentes estimadores. Cada uno de estos estimadores tiene su propio sesgo, aunque todos están (basados en) el mismo valor, la misma estadística.
Por lo tanto, decir "muestra media es imparcial" no tiene sentido. La media muestral es imparcial cuando la usa para estimar la media de distribución. Pero al mismo tiempo está sesgado cuando se usa para estimar la varianza de distribución.
Cantidades de distribuciones y cantidades de muestras.
Aquí la cantidad se refiere a alguna propiedad de la distribución, que generalmente es desconocida y, por lo tanto, debe estimarse. Esto contrasta con una estadística , que es una propiedad de una muestra, por ejemplo, la media de distribución es una cantidad de su distribución, mientras que la media de la muestra es una estadística (una cantidad de su muestra).
fuente
Este hilo es un poco viejo, pero parece que Wikipedia puede haber cambiado su definición y, si es preciso, me lo explica más claramente:
Entonces, una estadística se refiere a los datos en sí y a un cálculo con esos datos. Mientras que un estimador se refiere a un parámetro en un modelo.
Si lo entiendo correctamente, entonces, la media es una estadística y también puede ser un estimador. La media de una muestra es una estadística (suma de la muestra dividida por el tamaño de la muestra). La media de una muestra también es un estimador de la media de la población, suponiendo que se distribuya normalmente.
Le preguntaría a @whuber y a otros que realmente saben esto si la cita de Wikipedia (¿nueva?) Es correcta.
fuente
Dado que otras respuestas que dicen que son iguales no dan referencias autorizadas, permítanme darle dos citas del manual de inferencia estadística de Casella y Berger:
y
Estoy no diciendo aquí que esta es la respuesta definitiva a la cuestión, ya que parecen estar de acuerdo con las dos respuestas más upvoted que sugieren que hay una diferencia, sólo dar una referencia que dice lo contrario destacar que esto no es una caja clara.
fuente
"6" es un ejemplo de un estimador. Digamos que su pregunta era, "¿cuál es la pendiente de la mejor función lineal de mapeo xay?" Su respuesta podría ser "6". O podría ser . Ambos son estimadores. Cuál es mejor se le deja a usted decidir.(X′X)−1X′Y
Una TA realmente buena una vez me explicó el concepto de estimador de esa manera.
Básicamente, un estimador es algo que aplica a los datos para obtener una cantidad de la que no conoce el valor. Usted conoce el valor de una estadística: es una función de los datos que no tienen "lo mejor" u "óptimo" al respecto. No hay "mejor" significado. Solo hay un medio.
Supongamos que tiene un conjunto de datos sobre el número de cabras que posee cada persona y la felicidad de cada persona. Te interesa saber cómo cambia la felicidad de las personas con la cantidad de cabras que poseen. Un estimador puede ayudarlo a estimar esa relación a partir de sus datos. Las estadísticas son solo funciones de los datos que tiene. Por ejemplo, la variación de la propiedad de la cabra puede ser igual a 7. La fórmula para calcular la variación sería idéntica entre las cabras y las tostadoras, o si está interesado en la felicidad o la propensión a contraer cáncer. En ese sentido, todos los estimadores sensibles son estadísticas.
fuente
Interesante pregunta. Sin embargo, los estimadores y las estadísticas no necesitan ser cosas diferentes. Son conceptos diferentes.
Una estadística es una función (en términos generales) en la que la entrada son datos (estadísticos). El efecto es que obtienes un resultado, generalmente un número, de esta estadística. En un término más abstracto, una estadística puede producir más de un número. La estadística depende de los datos, pero el procedimiento es determinista. Por lo tanto, la estadística puede ser: "Suma todos los números y divide por el recuento" o, en el sentido más amplio, "toma los datos del pib y prepara un informe al respecto".
En el sentido estadístico, por supuesto, estamos hablando de una función matemática como estadística.
La importancia de esto es que si conoce las propiedades de los datos que ingresa (por ejemplo, que se trata de una variable aleatoria), puede calcular las propiedades de su estadística, sin incluir datos empíricos.
Los estimadores son estimadores debido a su intención: estimar una propiedad. Como resultado, algunas estadísticas son buenos estimadores.
Por ejemplo, si extrae puntos de datos de un conjunto de variables iid, entonces la media aritmética, una estadística basada en los datos que extrae, probablemente será un buen estimador del valor esperado de esa distribución. Pero, de nuevo, cualquier cosa que produzca una estimación es un estimador.
En la práctica, los estimadores que use serán estadísticas, pero hay estadísticas que no son estimadores. Por ejemplo, estadísticas de prueba: aunque se puede discutir sobre la semántica de esta declaración y, para empeorar las cosas, una estadística de prueba no solo puede ser sino que también incluye estimadores. Aunque conceptualmente este no tiene que ser el caso.
Y, por supuesto, puede tener estimadores que no son estadísticas, aunque probablemente no sean muy buenos para estimar.
fuente
Creo que una mejor comprensión de lo que es una muestra ayuda.
[Actualizado: la muestra es un concepto muy amplio, estaba hablando de "la muestra aleatoria". No sé si un estimador tiene sentido o no cuando la muestra no es aleatoria .]
de wikipedia :
Reemplazamos la muestra en el estimador por el valor de la muestra. Obtenemos un valor del estimador, esta es una medida específica. Y esta medida específica es una estadística.
(Verifique este enlace para la definición de un estimador, la última oración revela por qué siempre estamos confundidos).
fuente
El objetivo de este escrito:
Lo que quiero hacer aquí es proporcionarle las similitudes y diferencias entre los dos conceptos íntimamente llamados "estadística" y "estimador". Sin embargo, no quiero pasar por las diferencias entre un parámetro y una estadística, lo que supongo que es lo suficientemente claro para todos los que luchan con las diferencias entre una estadística y un estimador. Si no es el caso para usted, primero debe estudiar las publicaciones anteriores y luego comenzar a estudiar esta publicación.
Relación:
Básicamente, cualquier función de valores reales de variables aleatorias observables en una muestra se denomina estadística. Hay algunas estadísticas que si están bien diseñadas y tienen algunas buenas propiedades (por ejemplo, consistencia, ...), pueden usarse para estimar los parámetros de la distribución subyacente de la población. Por lo tanto, las estadísticas son un conjunto grande y los estimadores son un subconjunto dentro del conjunto de estadísticas. Por lo tanto, cada estimador es una estadística, pero no todas las estadísticas son un estimador.
Similitudes:
Hablando de las similitudes, como se mencionó anteriormente, ambas son funciones de variables aleatorias. Además, ambos tienen distribuciones llamadas "distribuciones de muestreo".
Diferencias:
Hablando de las diferencias, son diferentes en términos de sus objetivos y tareas. Los objetivos y las tareas de una estadística podrían ser resumir la información en una muestra (mediante el uso de estadísticas suficientes) y, a veces, hacer una prueba de hipótesis, etc. En contraste, el objetivo principal y la tarea de un estimador, como su nombre lo indica, es estimar Los parámetros de la población estudiada. Es importante mencionar que existe una amplia variedad de estimadores, cada uno de los cuales tiene su propia lógica computacional, como MOMEs, MLE, estimadores OLS, etc. Otra diferencia entre estos dos conceptos tiene que ver con sus propiedades deseadas. Si bien una de las propiedades más deseadas de una estadística es "suficiencia", las propiedades deseadas de un estimador son cosas como "consistencia", "imparcialidad", "precisión", etc.
Precaución:
Por lo tanto, debe tener cuidado al usar la terminología correctamente cuando trabaje con estadísticas y estimadores. Por ejemplo, no tiene mucho sentido hablar sobre el sesgo de una mera estadística, que de ninguna manera es un estimador, porque no hay ningún parámetro involucrado en dicho contexto para que podamos calcular el sesgo, y Hable al respecto. Por lo tanto, debe tener cuidado con la terminología.
La línea de fondo:
En resumen, cualquier función de variables aleatorias observables en una muestra es una estadística. Si una estadística tiene la capacidad de estimar un parámetro de una población, entonces lo llamamos estimador (del parámetro de interés). Sin embargo, hay algunas estadísticas que no están diseñadas para estimar parámetros, por lo que estas estadísticas no son estimadores, y aquí los llamamos "meras estadísticas".
Lo que ofrecí anteriormente es la forma en que miro y pienso en estos dos conceptos, e hice todo lo posible para ponerlo en palabras simples. ¡Espero que ayude!
fuente
Nueva respuesta a una vieja Q:
Definición 1. Una estadística es una función que asigna cada muestra a un número real.
Cada estimador es una estadística.
Pero tendemos a llamar solo a esas estadísticas que se utilizan para generar estimaciones ("conjeturas") algún parámetro como estimador.
Entonces, por ejemplo, el estadístico t y la media de la muestra son AMBAS estadísticas. La media de la muestra también es un estimador (porque a menudo la usamos para estimar la media real de la población).
En contraste, rara vez / nunca llamamos al estadístico t un estimador, porque rara vez / nunca lo usamos para estimar algún parámetro.
fuente
En pruebas de hipótesis :
Una estadística de prueba se trata de pruebas de hipótesis. Una estadística de prueba es una variable aleatoria dada / bajo la hipótesis nula. Ahora, algunos pueden llamar a una estadística el valor / medida de la estadística de prueba dada la muestra.
Con estos dos puede obtener el valor p, que es una medida que ayuda a rechazar o no rechazar la hipótesis nula. En general, una estadística es una estimación de cuán lejos / cerca de su hipótesis.
Este enlace puede ser útil.
fuente