¿Tiene sentido calcular intervalos de confianza y probar hipótesis cuando hay datos disponibles de toda la población?

10

¿Tiene sentido calcular intervalos de confianza y probar hipótesis cuando hay datos disponibles de toda la población? En mi opinión, la respuesta es no, ya que podemos calcular con precisión los valores verdaderos de los parámetros. Pero entonces, ¿cuál es la proporción máxima de datos de la población original que nos permite usar las técnicas antes mencionadas?

Miroslav Sabo
fuente
3
Si utiliza los métodos correctos de muestras finitas, la varianza se reduce a cero justo cuando su muestra alcanza el tamaño de la población. Es decir, no hay un tamaño máximo; las fórmulas adecuadas funcionan como deberían, hasta . norte=norte
Glen_b -Reinstate Monica
Creo que debería decirlo más claramente si la pregunta es sobre el caso "muestra = población" o el caso "muestra de población finita".
ttnphns
La primera parte de la pregunta es sobre la muestra = población y la segunda sobre la muestra de la población (cuando el tamaño de la muestra <tamaño de la población).
Miroslav Sabo

Respuestas:

9

La primera pregunta es aquella que generalmente no tiene una respuesta acordada. Mi propia opinión es como la suya, pero otros han argumentado que una población se puede ver como una muestra de una "superpoblación" donde la naturaleza exacta de una superpoblación varía según el contexto: por ejemplo, un censo de todas las personas que viven en un edificio podría verse como una muestra de todas las personas que viven en edificios similares; un censo de la población de los EE. UU. (No es que uno pueda estar realmente completo) podría verse como una muestra de una superpoblación de estadounidenses que algún día podría existir (o algo así). Creo que a menudo es una excusa para usar los valores p; muchos científicos en campos sustantivos no se sienten cómodos si no tienen un valor p. (Pero esa es mi opinión).

La segunda pregunta parece un poco extraña de responder de manera general. ¿Cuándo obtiene una muestra que es (digamos) incluso más de la mitad de la población?

Un problema mayor será el sesgo. Volviendo al censo de EE. UU., El problema no es simplemente que extraña a las personas, sino que las personas que extraña no son una muestra aleatoria de la población total; por lo tanto, incluso si el censo obtiene respuestas del 95% de todas las personas (para elegir un número), si ese 5% restante es bastante diferente, entonces los resultados serán sesgados.

Peter Flom - Restablece a Monica
fuente
1
Creo que si usted calcula o no los intervalos de confianza para una estadística de población depende de si desea hacer inferencias sobre la población real o para la hipotética "superpoblación". En un trabajo anterior con un departamento de salud estatal, informamos estadísticas anuales como porcentajes muy bajos de peso al nacer y tasas de suicidio que rebotaban de un año a otro. Sí, estábamos informando sobre toda la población, sin embargo, sería una tontería obstaculizar el progreso de salud del Estado (¡y la financiación!) En cada aumento o disminución de estos y otros indicadores de salud como un cambio completo en la salud de la población.
RobertF
7

Supongamos que solo 2 de cada 12 miembros del comité son mujeres.

16 6

O puede tomarse como una estimación de la probabilidad de que una mujer sea seleccionada para el comité, una propiedad del proceso de selección. Puede poner intervalos de confianza a su alrededor, probar si es significativamente diferente de la mitad (u otra hipótesis nula relevante), y así sucesivamente. Quizás sea necesario cambiar el proceso para que sea justo.

Los dos puntos de vista, descriptivos e inferenciales, no son contradictorios, sino bastante distintos.

La respuesta a la segunda pregunta es que tiene sentido calcular los intervalos de confianza para las hipótesis de prueba sobre un parámetro de población, incluso si no se muestrea a un solo individuo. Solo tenga en cuenta que los CI y las pruebas deben tener en cuenta una proporción considerable de la población que se está muestreando: ver corrección de población finita .

Scortchi - Restablece a Monica
fuente