¿Es alguna propiedad cuantitativa de la población un "parámetro"?

13

Estoy relativamente familiarizado con la distinción entre los términos estadística y parámetro. Veo una estadística como el valor obtenido al aplicar una función a los datos de la muestra. Sin embargo, la mayoría de los ejemplos de parámetros se relacionan con la definición de una distribución paramétrica. Un ejemplo común es la media y la desviación estándar para parametrizar la distribución normal o los coeficientes y la varianza de error para parametrizar una regresión lineal.

Sin embargo, hay muchos otros valores de la distribución de la población que son menos prototípicos (por ejemplo, mínimo, máximo, r-cuadrado en regresión múltiple, el cuantil .25, la mediana, el número de predictores con coeficientes distintos de cero, asimetría, el número de correlaciones en una matriz de correlaciones mayor que .3, etc.).

Por lo tanto, mis preguntas son:

  • ¿Debería alguna propiedad cuantitativa de una población ser etiquetada como "parámetro"?
  • Si es así, ¿por qué?
  • Si no, ¿qué características no deberían etiquetarse como parámetro? ¿Qué deberían ser etiquetados? ¿Y por qué?

Elaboración sobre confusión

El artículo de Wikipedia sobre estimadores establece:

Un "estimador" o "estimación puntual" es una estadística (es decir, una función de los datos) que se utiliza para inferir el valor de un parámetro desconocido en un modelo estadístico.

Pero puedo definir el valor desconocido como .25 cuantil y puedo desarrollar un estimador para ese desconocido. Es decir, no todas las propiedades cuantitativas de una población son parámetros de la misma manera que dicen que la media y la SD son parámetros de una distribución normal, sin embargo, es legítimo tratar de estimar cualquier propiedad cuantitativa de la población.

Jeromy Anglim
fuente

Respuestas:

15

Esta pregunta va al corazón de qué son las estadísticas y cómo realizar un buen análisis estadístico. Plantea muchos problemas, algunos de terminología y otros de teoría. Para aclararlos, comencemos observando el contexto implícito de la pregunta y luego continuemos para definir los términos clave "parámetro", "propiedad" y "estimador". Las diversas partes de la pregunta se responden a medida que surgen en la discusión. La sección final de conclusión resume las ideas clave.

Espacios estatales

Un uso estadístico común de "la distribución", como en "la distribución Normal con PDF proporcional a "es en realidad un abuso (grave) del inglés, porque obviamente esta no es una distribución: es una familia completa de distribucionesparametrizadaspor los símbolosμyσ. Una notación estándar para este es el "espacio de estado"Ω, unconjuntoexp(12(xμ)/σ)2)dxμσΩde distribuciones. (Estoy simplificando un poco aquí en aras de la exposición y continuaré simplificándolo a medida que avanzamos, sin dejar de ser lo más riguroso posible). Su función es delinear los posibles objetivos de nuestros procedimientos estadísticos: cuando estimamos algo, somos seleccionando uno (o a veces más) elementos de .Ω

A veces, los espacios de estado se parametrizan explícitamente, como en . En esta descripción hay una correspondencia biunívoca entre el conjunto de tuplas { ( μ , σ ) } en el medio plano superior y el conjunto de distribuciones que utilizaremos para modelar nuestros datos. Un valor de tal parametrización es que ahora podemos referirnos concretamente a distribuciones en Ω por medio de un par ordenado de números reales.Ω={N(μ,σ2)|μR,σ>0}{(μ,σ)}Ω

En otros casos, los espacios de estado no se parametrizan explícitamente. Un ejemplo sería el conjunto de todas las distribuciones continuas unimodales. A continuación, abordaremos la cuestión de si de todos modos se puede encontrar una parametrización adecuada en tales casos.

Parametrizaciones

Generalmente, una parametrización de es una correspondencia ( función matemática ) de un subconjunto de R d (con d finito) a Ω . Es decir, utiliza conjuntos ordenados de d -tuplas para etiquetar las distribuciones. Pero no se trata de una correspondencia cualquiera: tiene que "portarse bien". Para comprender esto, considere el conjunto de todas las distribuciones continuas cuyos archivos PDF tienen expectativas limitadas. Esto se consideraría ampliamente como "no paramétrico" en el sentido de que cualquier intento "natural" de parametrizar este conjunto implicaría una secuencia contable de números reales (utilizando una expansión en cualquier base ortogonal). Sin embargo, porque este conjunto tiene cardinalidad ΩRddΩd , que es la cardinalidad de los reales, debe existir cierta correspondencia uno-a-uno entre estas distribuciones y R . Paradójicamente, ¡eso parecería hacer de este unespacio de estadoparametrizadocon unúnicoparámetro real!1R

La paradoja se resuelve observando que un solo número real no puede disfrutar de una relación "agradable" con las distribuciones: cuando cambiamos el valor de ese número, la distribución a la que corresponde debe en algunos casos cambiar de manera radical. Descartamos tales parametrizaciones "patológicas" al exigir que las distribuciones correspondientes a valores cercanos de sus parámetros deben ser "cercanas" entre sí. Discutir definiciones adecuadas de "cerrar" nos llevaría demasiado lejos, pero espero que esta descripción sea suficiente para demostrar que hay mucho más en ser un parámetro que simplemente nombrar una distribución particular.

Propiedades de distribuciones.

A través de la aplicación repetida, nos acostumbramos a pensar en una "propiedad" de una distribución como una cantidad inteligible que aparece con frecuencia en nuestro trabajo, como sus expectativas, variación, etc. El problema con esto como una posible definición de "propiedad" es que es demasiado vago y no lo suficientemente general. (Aquí es donde estaban las matemáticas a mediados del siglo XVIII, donde las "funciones" se consideraban como procesos finitos aplicados a los objetos). En cambio, la única definición sensata de "propiedad" que siempre funcionará es pensar en una propiedad como siendo un número que se asigna de forma exclusiva a cada distribución en Ω. Esto incluye la media, la varianza, cualquier momento, cualquier combinación algebraica de momentos, cualquier cuantil y mucho más, incluidas cosas que ni siquiera se pueden calcular. Sin embargo, no incluye cosas que no tendrían sentido para algunos de los elementos de . Por ejemplo, si Ω consiste en todas las distribuciones t de Student, entonces la media no es una propiedad válida para Ω (porque t 1 no tiene media). Esto nos impresiona una vez más cuánto dependen nuestras ideas de en qué consiste realmente Ω .ΩΩΩt1Ω

Las propiedades no siempre son parámetros

Una propiedad puede ser una función tan complicada que no serviría como parámetro. Considere el caso de la "Distribución normal". Es posible que queramos saber si la media de la distribución verdadera, cuando se redondea al entero más cercano, es par. Eso es una propiedad. Pero no servirá como parámetro.

Los parámetros no son necesariamente propiedades

Cuando los parámetros y las distribuciones están en correspondencia uno a uno, entonces, obviamente, cualquier parámetro, y cualquier función de los parámetros, es una propiedad de acuerdo con nuestra definición. Pero no es necesario que exista una correspondencia uno a uno entre los parámetros y las distribuciones: a veces, algunas distribuciones deben describirse mediante dos o más valores claramente diferentes de los parámetros. Por ejemplo, un parámetro de ubicación para puntos en la esfera usaría naturalmente latitud y longitud. Eso está bien, excepto en los dos polos, que corresponden a una latitud dada y cualquier longitud válida. La ubicacion(punto en la esfera) de hecho es una propiedad, pero su longitud no es necesariamente una propiedad. Aunque existen varias evasiones (solo declare que la longitud de un polo es cero, por ejemplo), este problema destaca la importante diferencia conceptual entre una propiedad (que está asociada de forma exclusiva con una distribución) y un parámetro (que es una forma de etiquetar la distribución y podría no ser única).

Procedimientos estadísticos

El objetivo de una estimación se llama estimado . Es simplemente una propiedad. El estadístico no es libre de seleccionar el estimado: esa es la provincia de su cliente. Cuando alguien se le acerca con una muestra de una población y le pide que calcule el percentil 99 de la población, ¡probablemente sea negligente proporcionar un estimador de la media! Su trabajo, como estadístico, es identificar un buen procedimiento para estimar el estimado y el que le han dado. (A veces, su trabajo es persuadir a su cliente de que ha seleccionado el presupuesto equivocado para sus objetivos científicos, pero ese es un tema diferente ...)

Por definición, un procedimiento es una forma de obtener un número de los datos. Los procedimientos generalmente se dan como fórmulas para aplicar a los datos, como "sumarlos y dividirlos por su conteo". Literalmente, cualquier procedimiento se puede pronunciar como "estimador" de un estimado determinado. Por ejemplo, podría declarar que la media muestral (una fórmula aplicada a los datos) estima la varianza de la población (una propiedad de la población, suponiendo que nuestro cliente haya restringido el conjunto de poblaciones posibles para incluir solo aquellas que realmente tienen variaciones).Ω

Estimadores

Un estimador no necesita tener una conexión obvia con el estimado. Por ejemplo, ¿ve alguna conexión entre la media muestral y una varianza poblacional? Yo tampoco. Pero, sin embargo, la media muestral en realidad es un estimador decente de la varianza de la población para ciertos Ω (como el conjunto de todas las distribuciones de Poisson). Aquí radica una clave para comprender los estimadores: sus cualidades dependen del conjunto de posibles estados . Pero eso es solo una parte.Ω

Un estadístico competente querrá saber qué tan bien se realizará el procedimiento que recomienda. Llamemos al procedimiento " " y dejemos que el estimado sea θ . Sin saber qué distribución es la verdadera, contemplará el desempeño del procedimiento para cada distribución posible F Ω . Dada tal F , y dado cualquier resultado posible s (es decir, un conjunto de datos), comparará t ( s ) (lo que estima su procedimiento) con θ ( F ) (el valor del estimado para F ). tθ FΩFst(s)θ(F)FEs responsabilidad de su cliente decirle cuán cerca o lejos están esos dos. (Esto a menudo se hace con una función de "pérdida"). Luego puede contemplar la expectativa de la distancia entre y θ ( F ) . Este es el riesgo de su procedimiento. Debido a que depende de F , el riesgo es una función definida en Ω .t(s)θ(F)FΩ

(Bueno) los estadísticos recomiendan procedimientos basados ​​en la comparación de riesgos. Por ejemplo, suponga que por cada , el riesgo del procedimiento t 1 es menor o igual que el riesgo de t . Entonces no hay razón para usar t : es "inadmisible". De lo contrario, es "admisible".FΩt1tt

(Un estadístico "bayesiano" siempre comparará los riesgos promediando sobre una distribución "previa" de posibles estados (generalmente suministrada por el cliente). Un estadístico "frecuente" podría hacer esto, si existe tal justificación previa, pero también está dispuesto a compare los riesgos de otras maneras que evitan los bayesianos).

Conclusiones

Tenemos derecho a decir que cualquier que sea admisible para θ es un estimador de θ . tθθ Debemos, a efectos prácticos (porque los procedimientos admisibles pueden ser difíciles de encontrar), doblar esto para decir que cualquier que tenga un riesgo aceptablemente pequeño (en comparación con θ ) entre los procedimientos practicables es un estimador de θ . tθθ El cliente determina "aceptablemente" y "practicable", por supuesto: "aceptablemente" se refiere a su riesgo y "practicable" refleja el costo (finalmente pagado por ellos) de implementar el procedimiento.

Subyacentes a esta definición concisa se encuentran todas las ideas que acabamos de discutir: para comprenderla debemos tener en cuenta un específico (que es un modelo del problema, proceso o población en estudio), un estimado definitivo (suministrado por el cliente), un función de pérdida específica (que conecta cuantitativamente t con el estimado y también es dada por el cliente), la idea de riesgo (calculada por el estadístico), algún procedimiento para comparar funciones de riesgo (la responsabilidad del estadístico en consulta con el cliente), y una idea de qué procedimientos se pueden llevar a cabo realmente (el tema de "practicabilidad"), aunque ninguno de estos se menciona explícitamente en la definición.Ωt

whuber
fuente
2
@Nick Cox, en su respuesta, plantea algunos puntos excelentes que (en mi interpretación) van a "¿qué hacemos cuando sabemos que cualquier modelo y cualquier función de pérdida que especifiquemos será algo imprecisa o inadecuada?" La respuesta a eso nos llevaría en una dirección diferente; Todo lo que quiero decir aquí es que el marco que he establecido, que es el clásico al que Tukey estaba reaccionando, nos da una buena base para pensar sobre cuestiones más amplias de análisis de datos. Como mínimo, aclara los supuestos implícitos que entran en términos estándar como "estimador". Ω
whuber
11

Al igual que con muchas preguntas sobre definiciones, las respuestas deben tener en cuenta tanto los principios subyacentes como las formas en que se usan los términos en la práctica, que a menudo pueden ser un poco flojos o inconsistentes, incluso por personas que están bien informadas, y más importante, variable de comunidad en comunidad.

Un principio común es que una estadística es una propiedad de una muestra, y una constante conocida, y un parámetro es la propiedad correspondiente de la población, y por lo tanto una constante desconocida. La palabra "correspondiente" debe entenderse como bastante elástica aquí. Por cierto, precisamente esta distinción y precisamente esta terminología tienen menos de un siglo de antigüedad, habiendo sido introducidas por RA Fisher.

Pero

  1. Una configuración de muestra y población no caracteriza todos nuestros propios problemas. Las series de tiempo son una clase importante de ejemplos en los que la idea es más bien un proceso generador subyacente, y algo así es posiblemente la idea más profunda y más general.

  2. Hay configuraciones en las que cambian los parámetros. Nuevamente, el análisis de series de tiempo proporciona ejemplos.

  3. Al punto principal aquí, en la práctica no pensamos en todas las propiedades de una población o proceso como parámetros. Si algún procedimiento supone un modelo de distribución normal, entonces el mínimo y el máximo no son parámetros. (De hecho, según el modelo, el mínimo y el máximo son números negativos y positivos arbitrariamente grandes de cualquier manera, no es que eso nos preocupe).

Diría que por una vez Wikipedia apunta en la dirección correcta aquí, y la práctica y el principio son respetados si decimos que un parámetro es lo que estamos estimando .

Esto también ayuda con otras preguntas que han causado perplejidad. Por ejemplo, si calculamos una media recortada del 25%, ¿qué estamos estimando? Una respuesta razonable es la propiedad correspondiente de la población, que en efecto se define por el método de estimación. Una terminología es que un estimador tiene un estimado y lo que sea que esté estimando. Comenzando con una idea platónica de una propiedad "allá afuera" (por ejemplo, el modo de distribución) y pensando cómo estimar eso es razonable, al igual que pensar buenas recetas para analizar datos y pensar en lo que implican cuando se consideran inferencia.

Como a menudo en las matemáticas o ciencias aplicadas, hay un doble aspecto en un parámetro. A menudo pensamos en ello como algo real que estamos descubriendo, pero también es cierto que es algo definido por nuestro modelo del proceso, por lo que no tiene sentido fuera del contexto del modelo.

Dos puntos bastante diferentes:

  1. Muchos científicos usan la palabra "parámetro" en la forma en que los estadísticos usan la variable. Tengo una personalidad científica y estadística, y diría que es desafortunado. Las variables y las propiedades son mejores palabras.

  2. Es notablemente común en un uso más amplio del inglés que se cree que parámetro significa límites o límites, lo que puede deberse a cierta confusión original entre "parámetro" y "perímetro".

Una nota sobre el punto de vista estimado

La posición clásica es que identificamos un parámetro de antemano y luego decidimos cómo estimarlo, y esto sigue siendo una práctica mayoritaria, pero revertir el proceso no es absurdo y puede ser útil para algunos problemas. A esto lo llamo el punto de vista estimado. Ha estado en la literatura durante al menos 50 años. Tukey (1962, p.60) instó a que

"Debemos prestar aún más atención a comenzar con un estimador y descubrir qué es un estimado razonable, a descubrir qué es razonable pensar que el estimador es estimador".

Bickel y Lehmann (1975) elaboraron formalmente un punto de vista similar formalmente con considerable detalle y profundidad e informalmente con considerable lucidez por Mosteller y Tukey (1977, pp. 32-34).

También hay una versión elemental. Usar (por ejemplo) la mediana de la muestra o la media geométrica para estimar el parámetro de población correspondiente tiene sentido independientemente de si la distribución subyacente es simétrica, y la misma buena voluntad puede extenderse a (por ejemplo) las medias recortadas de la muestra, que se consideran estimadores de sus contrapartes de la población .

Bickel, PJ y EL Lehmann. 1975. Estadística descriptiva para modelos no paramétricos. II Ubicación . Annals of Statistics 3: 1045-1069.

Mosteller, F. y JW Tukey. 1977. Análisis de datos y regresión. Lectura, MA: Addison-Wesley.

Tukey, JW 1962. El futuro del análisis de datos . Anales de Estadística Matemática 33: 1-67.

Nick Cox
fuente
Gran parte de esto se ve en desacuerdo con la literatura estadística estándar, especialmente su definición de parámetro. Parece confundir los procesos de encontrar un procedimiento para calcular una estimación e identificar lo que se debe estimar. El último, la elección del estimado, es una cuestión que debe determinar el científico o investigador. Luego, el estadístico selecciona el primero para que tenga propiedades deseables entre todos los procedimientos posibles para estimar el estimado. También hay problemas técnicos; basta con decir que un parámetro está más restringido que un estimado arbitrario.
whuber
Ampliaré mi respuesta para abordar esto.
Nick Cox
1
Estoy de acuerdo con Tukey, aunque podría pensar por mi respuesta a este hilo que soy uno de los estadísticos "osificados" que desafía. El problema es que ha tomado su cita fuera de contexto. Tukey está abordando específicamente la cuestión de cómo evaluar las propiedades de los procedimientos "cuando las hipótesis sobre las que se desarrollan habitualmente no son válidas". Esto de ninguna manera cambia las definiciones de cosas como parámetros, estimadores y estimaciones. En particular, un parámetro todavía no es "lo que sea que estemos estimando".
whuber
3
Mucha comida para pensar aquí. Como respuesta rápida: mi respuesta no tenía la intención de implicar que estamos en Liberty Hall donde todo vale. El contexto de la cita de Tukey me agrada, ya que mi punto de vista es que es habitual que las hipótesis habituales no se mantengan en la medida en que todos los modelos son aproximaciones que no coinciden exactamente con los datos. Lejos de morder, esa cláusula subraya el valor de los diferentes puntos de vista. En general, no intento ni estoy calificado para producir definiciones formales más abstractas y más refinadas matemáticamente.
Nick Cox
6


pdf=12πσ2e12(xiμ)2σ2
12π3.1415926e2.718281828Xxiμσ2X25th%μσ2μσ2


Y=β0+β1X1+β2X2+εwhere εN(0,σ2)
β0β1β2σ225th%YX=xiβ0β1β2σ2β0β1β2σ2

(Todo esto supone, por supuesto, que mi modelo de distribución de la población o proceso de generación de datos es correcto. Vale, como siempre, tener en cuenta que "todos los modelos están equivocados, pero algunos son útiles" - George Box ).

Para responder a sus preguntas más explícitamente, diría:

  • No, cualquier vieja cuantitativa propiamente dicha no debe etiquetarse como "parámetro".
  • n / A
  • Las características que deben etiquetarse como "parámetro" dependen de la especificación del modelo. No tengo un nombre especial para otras características cuantitativas, pero creo que estaría bien llamarlas propiedades o características o consecuencias , etc.
gung - Restablece a Monica
fuente
Gracias. Pero, ¿qué terminología utiliza para describir todos los valores de población que pueden derivarse de un modelo paramétrico pero que no se encuentran en el conjunto de parámetros convenientes para representar ese modelo? O, alternativamente, puede haber un caso en el que no conozca el modelo de población y no le importe particularmente, pero esté interesado en un aspecto particular no estándar del modelo de población.
Jeromy Anglim
No tengo ningún nombre especial aplicable en general, pero hay nombres para algunos valores particulares. Por ejemplo, si realmente no cree que su población esté lo suficientemente cerca de una distribución bien estudiada, podría intentar caracterizarla por su mediana, cuartiles, puntos de bisagra, etc.
gung - Reinstale a Monica
3
β0,β1,β2,σθβ0θθθ
whuber
3

Ha habido algunas respuestas excelentes a esta pregunta, solo pensé en resumir una referencia interesante que proporciona una discusión bastante rigurosa de los estimadores.

La página de laboratorios virtuales sobre estimadores define

  • una estadística como "una función observable de la variable de resultado".
  • "en el sentido técnico, un parámetro θ es una función de la distribución de X "

El concepto de una función de distribución es una idea muy general. Por lo tanto, cada ejemplo proporcionado anteriormente podría verse como una función de una distribución determinada.

  • Cada cuantil, incluido el mínimo, mediano, 25º cuantil, el máximo puede ser función de una distribución.
  • La inclinación es una función de una distribución. Si esa distribución de la población es normal, entonces será cero, pero eso no detiene el cálculo de estos valores.
  • Contar el número de correlaciones mayores que cierto valor es una función de la matriz de covarianza que a su vez es función de una distribución multivariada.
  • R-cuadrado es una función de la distribución.
Jeromy Anglim
fuente
1
Una razón por la que ofrecí una respuesta más elaborada es que esta definición de "parámetro" no es lo suficientemente buena. Para un contraejemplo, vea mi comentario a la respuesta de @gung . Intuitivamente, un conjunto de distribuciones parametrizadas forma una variedad topológica con límite finito-dimensional; un parámetro tiene que ser una función continua definida en el múltiple. Esto es más que un requisito técnico, porque se relaciona con las distribuciones de muestreo de las estimaciones.
whuber