La respuesta trivial es que siempre se prefieren más datos a menos datos.
El problema del pequeño tamaño de muestra es claro. Técnicamente, en la regresión lineal (MCO) puede ajustarse a un modelo como MCO donde n = k + 1 pero obtendrá basura, es decir, errores estándar muy grandes. Hay un gran artículo de Arthur Goldberger llamado Micronumerocity sobre este tema, que se resume en el capítulo 23 de su libro A Course in Econometrics .
Una heurística común es que debe tener 20 observaciones para cada parámetro que desee estimar. Siempre es una compensación entre el tamaño de sus errores estándar (y, por lo tanto, las pruebas de importancia) y el tamaño de su muestra. Esta es una razón por la que algunos de nosotros odiamos las pruebas de significación, ya que puede obtener un error estándar increíblemente pequeño (relativo) con una muestra enorme y, por lo tanto, encontrar significación estadística inútil en pruebas ingenuas, como si un coeficiente de regresión es cero.
Si bien el tamaño de la muestra es importante, la calidad de su muestra es más importante, por ejemplo, si la muestra es generalizable a la población, es una Muestra aleatoria simple o alguna otra metodología de muestreo apropiada (y esto se ha tenido en cuenta durante el análisis), ¿hay algún error de medición? , sesgo de respuesta, sesgo de selección, etc.