Tengo referencias que aconsejaron considerar un tamaño de muestra mínimo de 20 para la distribución de ajuste de datos.
¿Tiene algún sentido esto?
Gracias
sample-size
fm3c2007
fuente
fuente
Respuestas:
Mucho de esto depende de la distribución esperada y de cuál es su pregunta de investigación. Como regla general, debe tener cuidado con las reglas generales. Si conoce la distribución esperada, ejecute algunas simulaciones de diferentes tamaños y determine con qué frecuencia las simulaciones de muestra reflejan la distribución real. Esto debería darle alguna orientación como el tamaño de muestra final requerido.
fuente
Pensé que el número mágico del tamaño de la muestra es 1,000. Eso es lo que tienen la mayoría de las encuestas nacionales de EE. UU., Para producir un margen de error de aproximadamente el 3%: En realidad, los tamaños de muestra efectivos son más bajos de 1,000, más o menos 700, más o menos, debido a la desigual probabilidad de selección y ajustes por falta de respuesta, lo que lleva al margen de error de 3.7%.
Con solo 20 observaciones, técnicamente no puede obtener valores muy altos de asimetría y curtosis (normalizado por las desviaciones estándar de la muestra, por supuesto):
Se puede tomar otra visión sobre el ajuste de la distribución a través de la estimación de la densidad del núcleo: para la muestra de tamaño , la regla más popular da el ancho de banda de que efectivamente abarca toda la distribución utilizando el núcleo gaussiano. En otras palabras, la mayoría de las muestras de tamaño 20 se verán normales si ejecuta la estimación de la densidad del núcleo a través de ellas, a menos que claramente tengan una curtosis notable (lo que significaría que hay algunas observaciones periféricas que se mostrarán como protuberancias separadas en la densidad del núcleo trama).h = 1,06 σ n - 1 / 5 = 0,58 σn = 20
fuente
No No remotamente
Piénselo de esta manera: si tuviera un espacio de mil millones de dimensiones (humanidad) y extrajera 20 muestras usando cualquier método (20 personas), ¿podría usar la información obtenida para comprender razonablemente bien a cada persona en el planeta? No remotamente Hay 100 mil millones de estrellas en la galaxia Vía Láctea. Al elegir (al azar) 20 de ellos, ¿puedes entender toda la astronomía galáctica? De ninguna manera.
En un espacio de 1-d hay algunas heurísticas, en su mayoría reglas generales válidas que pueden ayudar, que describen cuántas medidas desea tomar. Incluyen diversos grados de utilidad y justificación, pero en cierto sentido están mejor defendidos que "20". Incluyen "5 mediciones por variable en su ecuación de ajuste", "al menos 35 muestras de una función de densidad gaussiana" y "al menos 300 muestras de una función binomial". Los estadísticos reales y no un nerd-bombardero como yo podrán asociar intervalos de confianza e incertidumbres particulares de los primeros principios y sin una calculadora.
Recuerde que "mejor" es una idea sin sentido sin tener una "medida de bondad". ¿Cuál es el mejor camino? Si vas a tu destino, quizás sea extremadamente largo y agradable. Si vas a tu propia coronación, tal vez una corta y magnífica. Si estás caminando por el desierto, uno fresco y sombreado. ¿Cuál es el "mejor" número de muestras? Depende tan asombrosamente de su problema que no puede comenzar a ser respondido con autoridad antes de eso. ¿Todos ellos? ¿Tantos como puedas? Esos solo tienen un poco de sentido. Sí, es como estar parcialmente muerto o embarazada. Ser parcialmente insensato es consecuencia de un problema muy poco definido.
Si está tratando de pronosticar con precisión el flujo de aire sobre un avión? Es posible que necesite varios millones de mediciones para ingresar al parque de pelota. Si quieres saber qué tan alto eres, uno o dos pueden hacer el trabajo.
Esto no saca a relucir los puntos importantes de "abarcar el espacio" y "muestrear en lugares que minimizan la variación en las estimaciones de parámetros", pero la pregunta sugería que sería relevante una respuesta más a nivel de primer año. Estas cosas requieren saber más sobre la naturaleza del problema antes de que puedan implementarse.
Nota: editado para mejorar según las sugerencias.
fuente
Tal vez para el contexto en el que está realizando pruebas t o ANOVAR, un contexto bastante común en aplicaciones estadísticas básicas, se trata del tamaño de muestra que necesita para cada grupo para poder tener mucha confianza en que la media de cada grupo sea aproximadamente normalmente distribuido (de acuerdo con el teorema del límite central) cuando se puede suponer que la distribución es más o menos unimodal y no extremadamente pico. Veinte y no diecinueve o veintiuno porque es un número redondo.
fuente
Consulte la página de Poder y Tamaño de muestra de Russ Lenth para ver algunos artículos sobre el tema (en la sección de Consejos en el medio de la página).
El número mínimo de individuos en su muestra varía enormemente según el tamaño de la población, el número de dimensiones (si está dividiendo los datos en categorías) y las medidas (si está tomando medidas continuas sobre los individuos de la muestra) que está tomando, el tamaño de su universo, la técnica de análisis que pretende utilizar (este es un punto muy importante: la técnica se define durante la planificación del estudio o durante el diseño experimental , nunca después) y la complejidad mostrada por estudios anteriores.
Y 20 no es suficiente para ninguna investigación seria fuera de los temas de "enfermedades raras" y "psicología experimental" (psicología como Popper definió en su trabajo).
Refinando la respuesta basada en los comentarios a continuación:
Y 20 no es suficiente para ninguna investigación seria fuera de los temas de "enfermedades raras" y "psicología experimental" (psicología como Popper definió en su trabajo) que implica ajustar una distribución de probabilidad .
Y no, no debe seguir envenenando a las personas para obtener una muestra de gran tamaño. El sentido común y las pruebas secuenciales le ordenan detenerse.
fuente