¿Regresión múltiple en estadística direccional / circular?

9

Estoy tratando de desarrollar un modelo predictivo para una variable dependiente angular (en [0 0,2π]) utilizando varias mediciones independientes, también variables angulares, en [0 0,2π]- Como predictores. Cada predictor está significativamente pero no extremadamente fuertemente correlacionado con la variable dependiente. ¿Cómo puedo combinar los predictores para determinar un modelo predictivo para la variable dependiente que sea óptimo en algún sentido? ¿Y cómo puedo identificar rigurosamente los predictores más fuertes?

Para variables en espacios euclidianos, emplearía regresión múltiple (o similar) y análisis de componentes principales. Pero la periodicidad de todas las variables mucks con estos enfoques, por ejemplo, 0.02 debe estar altamente correlacionada con 6.26, pero no con 3.14. ¿Cómo se generalizan los procedimientos "habituales" a las estadísticas direccionales / circulares? Cualquier idea o cita de referencias útiles sería útil. (Ya conozco los textos de N. Fisher y Mardia & Jupp, pero no tengo acceso práctico a estos).

usuario44436
fuente

Respuestas:

5

En el libro que tengo dice que solo recientemente algunos artículos han comenzado a explorar la regresión multivariada donde una o más variables son circulares. No los he verificado yo mismo, pero las fuentes relevantes parecen ser:

Bhattacharya, S. y SenGupta, A. (2009). Análisis bayesiano de modelos semiparamétricos lineales circulares. Revista de estadísticas agrícolas, biológicas y ambientales , 14, 33-65.

Lund, U. (1999). Regresión de distancia circular mínima para datos direccionales. Journal of Applied Statistics , 26, 723-733.

Lund, U. (2002). Regresión basada en árboles o una respuesta circular. Comunicaciones en Estadística - Teoría y Métodos , 31, 1549-1560.

Qin, X., Zhang, J.-S. y Yan, X.-D. (2011) Un modelo de regresión multivariante circular-lineal no paramétrico con un selector de ancho de banda de regla general. Computadoras y Matemáticas con Aplicaciones , 62, 3048-3055.


En el caso de una respuesta circular, solo tiene un regresor circular único (lo que entiendo que no es el caso para usted, pero tal vez las regresiones separadas también sean de interés) hay una manera de estimar el modelo. [1] recomienda ajustar el modelo lineal general

cos(Θj)=γ0 0C+k=1metro(γCkCcos(kψj)+γskCpecado(kψj))+ε1j,
pecado(Θj)=γ0 0s+k=1metro(γCkscos(kψj)+γskspecado(kψj))+ε2j.

Lo bueno es que este modelo se puede estimar usando la función lm.circular de la biblioteca R circular .

[1] Jammalamadaka, SR y SenGupta, A. (2001). Temas en estadística circular . World Scientific, Singapur.

Julius Vainora
fuente
1

Puede echar un vistazo a estos artículos que abordan la regresión múltiple cuando la variable dependiente es circular o esférica. El enfoque se basa en la distribución normal proyectada.

Hernández-Stumpfhauser, Daniel, F. Jay Breidt y Mark J. van der Woerd. "La distribución normal general proyectada de la dimensión arbitraria: modelado e inferencia bayesiana". Análisis Bayesiano 12.1 (2017): 113-133.

Wang, Fangpo y Alan E. Gelfand. "Análisis de datos direccionales bajo la distribución normal proyectada general". Metodología estadística 10.1 (2013): 113-127

Nuñez-Antonio, Gabriel, Eduardo Gutiérrez-Peña y Gabriel Escarela. "Un modelo de regresión bayesiana para datos circulares basado en la distribución normal proyectada". Modelado estadístico 11.3 (2011): 185-201.

Presnell, Brett, Scott P. Morrison y Ramon C. Littell. "Modelos lineales multivariados proyectados para datos direccionales". Revista de la Asociación Americana de Estadística 93.443 (1998): 1068-1077.

Este último fue el primero en salir usando este enfoque normal proyectado

usuario160744
fuente