Esto podría ser como las preguntas más tontas que se hayan hecho en este foro, pero habiendo recibido respuestas sólidas y significativas a una pregunta anterior, pensé que volvería a estirar mi suerte.
He estado muy confundido durante algún tiempo sobre la importancia de las distribuciones estadísticas, especialmente en lo que respecta a los rendimientos de los activos e incluso más específicamente en la asignación de activos.
Mi pregunta para ser específica es esta: supongamos que tengo 20 años de datos de devoluciones mensuales de S&P 500, ¿por qué debería tener que asumir un cierto tipo de distribución (es decir, vuelo Normal / Johnson / Levy, etc.) para mi decisión de asignación de activos cuando puedo simplemente ¿solo tomo mis decisiones de asignación de activos en función de los datos históricos que tengo conmigo?
fuente
Respuestas:
El uso de una distribución supuesta (es decir, análisis paramétrico) reducirá el costo computacional de su método. Supongo que le gustaría realizar una tarea de regresión o clasificación. Esto significa que en algún momento va a estimar la distribución de algunos datos. Los métodos no paramétricos son útiles cuando los datos no se ajustan a una distribución bien estudiada, pero generalmente requieren más tiempo para calcular o más memoria para almacenar.
Además, si los datos son generados por un proceso que se ajusta a una distribución, ya que son un promedio de algunos procesos aleatorios uniformes, entonces usar esa distribución tiene más sentido. En el caso de promediar un conjunto de variables uniformes, la distribución correcta es probablemente la Distribución Gaussiana.
fuente
Complementando la respuesta de James : los modelos paramétricos también (generalmente) requieren menos muestras para tener un buen ajuste: esto puede aumentar su poder de generalización: es decir, pueden predecir mejor los nuevos datos, incluso estar equivocados. Por supuesto, esto depende de la situación, los modelos y los tamaños de muestra.
fuente