Al aprender el curso de muestreo, me encuentro con las siguientes dos afirmaciones:
1) El error de muestreo conduce principalmente a la variabilidad, los errores que no son de muestreo conducen al sesgo.
2) Debido a un error de no muestreo, una muestra es a menudo más precisa que un CENSO.
No sé cómo entender estas dos declaraciones. ¿Cuál es la lógica subyacente para obtener estas dos declaraciones?
estimation
sampling
survey
bias
usuario785099
fuente
fuente
Respuestas:
Una muestra podría ser más precisa que un censo (intentado) si el hecho de que el ejercicio sea un censo aumenta el sesgo del error no muestral. Esto podría ocurrir, por ejemplo, si el censo genera una campaña política adversa que aboga por la no respuesta (algo menos probable que le suceda a una muestra). A menos que esto suceda, no puedo ver por qué se esperaría que una muestra tenga menos error de no muestreo que un censo; y por definición tendrá más error de muestreo. Entonces, aparte de circunstancias bastante inusuales, diría que un censo será más preciso que una muestra.
Considere una fuente común de error no muestral: la falta de respuesta sistemática, por ejemplo, por un grupo sociodemográfico particular. Si es probable que las personas del grupo X rechacen el censo, tienen la misma probabilidad de rechazar la muestra. Incluso con posestratificación muestreo para ponderar las respuestas de las personas del grupo X, que se hace a persuadir a responder a sus preguntas, usted todavía tiene un problema porque los podría ser el segmento de X que están a favor de las encuestas. No hay otra forma de solucionar este problema que no sea ser lo más cuidadoso posible con su diseño de instrumento y método de entrega.
De paso, esto llama la atención sobre un posible problema que podría hacer que un intento de censo sea menos preciso que una muestra. Las muestras habitualmente tienen ponderación posterior a la estratificación para la población, lo que mitiga los problemas de sesgo de cuestiones como la de mi párrafo anterior. Un intento de censo que no obtiene un rendimiento del 100% es solo una muestra grande y, en principio, debe estar sujeto al mismo procesamiento; pero debido a que es visto como un "censo" (en lugar de un intento de censo) esto puede ser descuidado. Por lo tanto, ese censo podría ser menos exacto que la muestra ponderada adecuadamente. Pero en este caso el problema es la técnica de procesamiento analítico (u omisión de), no algo intrínseco a que sea un intento de censo.
La eficiencia es otra cuestión: como dice Michelle, una muestra bien realizada será más eficiente que un censo, y puede tener una precisión suficiente para fines prácticos.
fuente
Creo que hay situaciones prácticas en las que una muestra puede ser más precisa. Por ejemplo, hicimos un estudio en una ciudad de un país en desarrollo con muchas personas que viven en lugares no registrados y personas que van y vienen constantemente y tienen miedo de responder. Intentar realmente hacer un censo habría requerido un esfuerzo hercúleo y, dados nuestros recursos, habría tenido que hacerse en el transcurso de un par de meses, cuando la gente iría y vendría. Con una muestra, podríamos pasar más tiempo asegurándonos de obtener la respuesta más cercana posible, porque podríamos explicar lo que estábamos haciendo, y podríamos hacerlo en un período de tiempo mucho más corto que eliminaría el problema. de personas entrando y saliendo de la ciudad.
Entonces, creo que la respuesta depende más de la logística de lo que está haciendo y de las diversas fuentes de error no muestral.
De hecho, otra fuente fue que nuestra encuesta era compleja y teníamos que capacitar a los entrevistadores, y encontrar y financiar suficientes entrevistadores capacitables en ese país sería muy difícil.
fuente
Al muestrear humanos para encuestas, las muestras a menudo sufren tanto de error de muestreo (solo estamos obteniendo estimaciones) como de error de no muestreo (por ejemplo, personas que se niegan a responder la encuesta, no muestrear al marco de la muestra que uno necesita debido a consideraciones prácticas como el costo, o incapacidad para identificar la población con precisión a fin de extraer la muestra). Hecho correctamente, con altas tasas de respuesta, una muestra es más eficiente que un censo. Pero es incorrecto suponer que ninguna muestra contiene un error que no sea de muestreo.
fuente
Creo que la clave está en la respuesta de Peter Ellis: "intento". Cuando realiza un muestreo adecuado, se preocupa por los detalles de la falta de respuesta, descifra los estratos y los busca, etc. Cuando decide hacer un censo, es fácil ignorar esos problemas, ya que está recibiendo a "todos". El problema es que probablemente no estás recibiendo a todos, pero no estás pensando en quién no estás realmente recibiendo.
También hay problemas estadísticos con muestras extremadamente grandes (como proporción de la población muestreada). No soy lo suficientemente sofisticado como para entenderlos, pero como mínimo tienes problemas con los cálculos de varianza. (Los paquetes como los de R
survey
compensan tales cosas en grandes subpoblaciones de una encuesta, y ahí es donde aprendí por primera vez sobre esto).Como problema secundario, si el error ajeno a la muestra incluye problemas debidos al control de calidad en varios pasos del proceso, tener una cantidad enormemente mayor de datos (censo) haría mucho más difícil tener el nivel de control de calidad que tendría (con el mismo recursos) en un conjunto de datos más pequeño (muestra).
Imagínese si tuviera los recursos (financieros y de personal) que la Oficina del Censo de los EE. UU. Usó para un censo, pero solo estaba haciendo una encuesta a 1,000 adultos al azar. Creo que tendrías un control de calidad mucho mejor y un análisis mucho mejor de los problemas involucrados y de los datos en sí.
fuente
Pensé que la razón por la cual el muestreo puede ser (no es) más preciso que el censo en realidad tenía un componente que es atribuible a la naturaleza de un censo versus una muestra, y que se puede atribuir como la causa de que un censo potencialmente tenga un mayor sesgo (obviamente no muestreo, por definición): en un censo, el número de población es generalmente desconocido. Por lo tanto, minimizar o controlar el sesgo de falta de respuesta es mucho más difícil que hacerlo con una muestra de tamaño conocido.
fuente