Esta es la definición de estadística en wikipedia
Más formalmente, la teoría estadística define una estadística como una función de una muestra donde la función en sí es independiente de la distribución de la muestra; es decir, la función se puede establecer antes de la realización de los datos. El término estadística se usa tanto para la función como para el valor de la función en una muestra dada.
Creo que entiendo la mayor parte de esta definición, sin embargo, la parte - donde la función es independiente de la distribución de la muestra que no he podido resolver.
Mi comprensión de la estadística hasta ahora
Una muestra es un conjunto de realizaciones de un cierto número de variables aleatorias independientes, distribuidas idénticamente (iid) con distribución F (10 realizaciones de un lanzamiento de un dado justo de 20 lados, 100 realizaciones de 5 lanzamientos de un dado justo de 6 lados, atrae al azar a 100 personas de una población).
Una función, cuyo dominio es ese conjunto, y cuyo rango son los números reales (o tal vez puede producir otras cosas, como un vector u otro objeto matemático ...) se consideraría una estadística .
Cuando pienso en ejemplos, la media, la mediana y la varianza tienen sentido en este contexto. Son una función en un conjunto de realizaciones (mediciones de presión arterial de una muestra aleatoria). También puedo ver cómo un modelo de regresión lineal podría considerarse una estadística : ¿no se trata solo de una función en un conjunto de realizaciones?
Donde estoy confundido
Suponiendo que mi comprensión desde arriba es correcta, no he podido entender dónde una función podría no ser independiente de la distribución de la muestra. He estado tratando de pensar en un ejemplo para darle sentido, pero no tuve suerte. Cualquier idea sería muy apreciada!
fuente
Interpreto eso como diciendo que debes decidir antes de ver los datos qué estadística vas a calcular. Entonces, por ejemplo, si va a eliminar valores atípicos, debe decidir antes de ver los datos qué constituye un "valor atípico". Si decide después de ver los datos, su función depende de los datos.
fuente