Pruebas como Z, t y varias otras suponen que los datos se basan en un muestreo aleatorio. ¿Por qué?
Supongamos que estoy haciendo una investigación experimental, donde me importa mucho más la validez interna que la externa. Entonces, si mi muestra podría estar un poco sesgada, está bien, ya que he aceptado no inferir la hipótesis para toda la población. Y la agrupación seguirá siendo aleatoria, es decir, elegiré por conveniencia a los participantes de la muestra, pero los asignaré aleatoriamente a diferentes grupos.
¿Por qué no puedo ignorar esta suposición?
Respuestas:
Si no está haciendo ninguna inferencia para un grupo más amplio que su muestra real, entonces no hay aplicación de pruebas estadísticas en primer lugar, y no surge la cuestión del "sesgo". En este caso, simplemente calcularía estadísticas descriptivas de su muestra, que son conocidas. Del mismo modo, no se trata de la "validez" del modelo en este caso: solo está observando variables y registrando sus valores, y descripciones de los aspectos de esos valores.
Una vez que decida ir más allá de su muestra, para hacer inferencias sobre algún grupo más grande, necesitará estadísticas y tendrá que considerar cuestiones como el sesgo de muestreo, etc. En esta aplicación, el muestreo aleatorio se convierte en una propiedad útil para ayudar a ser confiable inferencias del grupo más amplio de interés. Si no tiene un muestreo aleatorio (y no conoce las probabilidades de sus muestras basadas en la población), entonces se hace difícil / imposible hacer inferencias confiables sobre la población.
fuente
En la investigación científica real, es bastante raro tener datos provenientes de un muestreo aleatorio verdadero. Los datos son casi siempre muestras de conveniencia. Esto afecta principalmente a qué población se puede generalizar. Dicho esto, incluso si fueran una muestra de conveniencia, vinieron de algún lugar, solo necesita ser claro sobre dónde y las limitaciones que eso implica. Si realmente cree que sus datos no son representativos de nada, entonces su estudio no valdrá la pena en ningún nivel, pero eso probablemente no sea cierto 1 . Por lo tanto, a menudo es razonable considerar sus muestras como extraídas de alguna parte y utilizar estas pruebas estándar, al menos en un sentido cubierto o calificado.
Sin embargo, existe una filosofía diferente de las pruebas que argumenta que debemos alejarnos de esos supuestos y las pruebas que se basan en ellos. Tukey fue un defensor de esto. En cambio, la mayor parte de la investigación experimental se considera (internamente) válida porque las unidades de estudio (p. Ej., Pacientes) se asignaron aleatoriamente a los brazos. Dado esto, puede usar pruebas de permutación , que en su mayoría solo asumen que la aleatorización se realizó correctamente. El argumento en contra de preocuparse demasiado por esto es que las pruebas de permutación generalmente mostrarán lo mismo que las pruebas clásicas correspondientes, y tienen más trabajo para realizar. De nuevo, las pruebas estándar pueden ser aceptables.
1. Para más información en este sentido, puede ser útil leer mi respuesta aquí: Identificar la población y las muestras en un estudio .
fuente
Las pruebas como Z, t y varias otras se basan en distribuciones de muestreo conocidas de las estadísticas relevantes. Esas distribuciones de muestreo, como se usan generalmente, se definen para la estadística calculada a partir de una muestra aleatoria.
A veces puede ser posible diseñar una distribución de muestreo relevante para el muestreo no aleatorio, pero en general probablemente no sea posible.
fuente