Manejo de datos faltantes al probar el CAPM

5

Pregunta

¿Cómo debo tratar con los datos faltantes cuando intento probar el CAPM? Específicamente, hay algunas acciones que están recientemente listadas y / o eliminadas en cualquier momento. No quiero excluir activos para los que no tengo datos completos porque esto crearía una especie de sesgo de supervivencia. Sé que CRSP proporciona retornos de la lista que deberían, pero ¿cómo manejo los datos faltantes en la práctica? Por ejemplo, en el modelo sin restricciones, el procedimiento se ve así:

ingrese la descripción de la imagen aquí

Zitt

Algunos detalles sobre el procedimiento de estimación

Para concretar, supongamos que quisiera probar el CAPM usando el marco de regresión de series de tiempo descrito en el capítulo 6 de Campbell, Lo y MacKinley (The Econometrics of Financial Markets). Algunos de los supuestos se enumeran en esta imagen: ingrese la descripción de la imagen aquí

jmbejara
fuente
El problema es que a veces no se observan los factores (lado derecho Zkt). ¿O es que se pueden observar los retornos (elementos del lado izquierdo de Zt)?
BKay
Zt

Respuestas:

5

Solución más fácil: si le preocupa, debería valorar el peso de sus resultados . Esto es sugerido por, por ejemplo, Kothari, Shanken y Sloan (1995) . Las empresas que se excluyen de la lista tienden a tener una capitalización de mercado extremadamente pequeña, por lo que la ponderación del valor les da muy poco impacto en las estadísticas resumidas. Los retornos de la lista también deberían usarse, aunque no estoy seguro de cuánto impacto tendrán. He visto el retorno de la lista atrapado en el mes después de que una acción deja de cotizarse.

β

Editar: aquí hay una perspectiva diferente .

Jayk
fuente
Gracias por los excelentes enlaces. Tengo muchas ganas de leerlos más en profundidad. Solo una pregunta sobre el comentario sobre el uso de los retornos de la lista. ¿Estás hablando de hacer esto en el contexto de un enfoque de regresión de tipo Fama-Macbeth? No estoy seguro de cómo encaja eso en el enfoque de series de tiempo de máxima probabilidad descrito anteriormente. Quiero decir, no es gran cosa, solo tengo curiosidad si eso es lo que quieres decir.
jmbejara
No particularmente. Creo que el mismo procedimiento de ponderación de valor podría usarse para cualquier procedimiento que desee. Para MLE, solo cambiará ligeramente el cálculo de su probabilidad. Sin embargo, ¿se parecen a GMM? En cualquier caso, la ponderación de valor aún podría hacerse.
Jayk
1

Mi sugerencia para usted, y esta es una técnica muy general cuando no está seguro de qué método usar, es dejar que la validación cruzada le diga qué método funciona mejor.

Me imagino que tienes un par de opciones:

  • No incluye ninguna fila con observaciones faltantes
  • ΩΩ^
  • Utilice la sustitución de medias o alguna otra estrategia de marcador de posición

Probability(Missing)

La mejor manera es dejar que los datos conduzcan sus resultados. Ejecute todos estos métodos en el 80% de los datos, verifique el error de predicción en el 20% restante y mezcle estos grupos, tome el error de predicción medio y seleccione el método que proporcionó el error de predicción más bajo.

CarrKnight
fuente
No estoy seguro de que la validación cruzada ayude aquí. Según lo veo, el problema no es obtener el mejor ajuste por ninguna definición empírica de mejor (para qué sirve la validación cruzada). En cambio, el problema para mí es qué debería encajar para capturar un concepto económico (precios de factores), con el cual la validación cruzada no ayudará.
Jayk
La validación cruzada no está ahí para obtener el mejor ajuste, está ahí para elegir entre modelos / familias funcionales. Aquí el modelo de regresión es fijo, pero el modelo para corregir los datos faltantes no lo es, y creo que la validación cruzada es una forma muy válida de decidir entre ellos.
CarrKnight
Pero el criterio por el cual juzgas a los modelos es su ajuste. La validación cruzada se trata de regresiones predictivas. Si estuviera tratando de predecir solo los precios de las acciones, estaría en lo cierto al respecto. Pero estás probando un modelo económico, no haciendo predicciones. Estaría dispuesto a apostar que un buen ajuste de prueba provendría (digamos) básicamente excluyendo acciones con quiebras. Pero esto no necesariamente correspondería a una buena prueba del modelo económico, ya que las bancarrotas pueden ser algo que debemos tener en cuenta al comprar acciones. Necesita un criterio de validación cruzada que no se presente para juzgar eso.
Jayk