¿Cómo probar si una matriz de covarianza ha cambiado en dos puntos de tiempo?

13

Mi tarea es probar si hay un cambio en la matriz de covarianza de 6 variables. Los valores de 6 variables se miden dos veces a partir de los mismos sujetos (3 años entre mediciones).

¿Cómo puedo hacer eso? He estado haciendo la mayor parte de mi trabajo usando SAS.

Janne
fuente
Gracias por sus respuestas. Estaba pensando en el recuadro M, pero no estaba seguro de si se aplica a medidas repetidas. Tenía que conseguir el libro de Rencher. Estoy bastante seguro de que la comparación de modelos anidados también se puede usar, por ejemplo, con un proceso mixto de SAS. Sin embargo, gracias! Soy nuevo aquí y espero que algún día pueda proporcionar algunas respuestas también: o)
Janne
Bienvenido al sitio! Muchas gracias son bienvenidas, pero en este sitio no debe darlas como respuesta. Puede expresar su gratitud votando las respuestas que le gustan y aceptando la que más le gustó. También puede agregar comentarios a la respuesta. También ayuda si haces la pregunta de las cosas que intentaste o crees que podrían ser de ayuda para resolver el problema.
mpiktas

Respuestas:

11

Suponiendo que sus distribuciones son multivariadas normales (como las pruebas para matrices de covarianza tienden a suponer que, de todos modos), su hipótesis nula es que las dos poblaciones difieren solo por cambio. Puede probar esto con una prueba de Kolmogorov-Smirnov en los dos grupos de datos de los que se sustrajeron sus medias.

Rencher (2002) (Sec. 7.3.2) proporciona el estadístico de prueba de razón de probabilidad para comparar dos matrices (Cuadro M-test) de la siguiente manera:

M=|S1|ν1/2|S2|ν2/2/|Sp|(ν1+ν2)/2

donde y son las matrices de covarianza de muestra en las dos muestras, es la matriz de covarianza agrupada, y son los grados de libertad (tamaño de muestra menos 1). Asintóticamente, sigue la con grados de libertad donde es el tamaño de las matrices. Rencher (2002) también da la versión corregida por Bartlett de la prueba y una aproximaciónSin embargo, esta es una prueba de dos muestras, en lugar de la prueba de medidas repetidas, por lo que puede ser algo conservador.S 2 S p ν 1 ν 2 - 2 log M χ 2 p ( p + 1 ) / 2 p FS1S2Spν1ν22logMχ2p(p+1)/2pF

StasK
fuente
¿Cuál es una alternativa de la prueba M de Box para la homogeneidad de las matrices de covarianza si las distribuciones no son multivariadas normales?
Nick
Yo diría que es inaplicable. Todo tiene que ser normal para que se apliquen las razones de probabilidad. De lo contrario, tendría que ir a estadísticas basadas en momentos y luego necesitaría momentos de cuarto orden para obtener covarianzas de covarianzas.
StasK
8

Podría usar el software de modelado de ecuaciones estructurales. Este es un bosquejo de cómo podría funcionar el proceso en Amos:

  • Agregue todas sus variables para el tiempo 1 ( ) y el tiempo 2 ( )Y 1 , . . . , Y 6X1,...,X6Y1,...,Y6
  • Dibuje flechas de dos puntas entre todas las variables (es decir, está informando al software que todas las variaciones y covarianzas son libres de variar y, por lo tanto, su modelo debe representar perfectamente los datos)
  • Nombra todas las variaciones y covarianzas.
  • Lo anterior es el modelo 1 (es decir, sin restricciones de igualdad)
  • Luego agregue declaraciones de igualdad al modelo 2 (es decir, varianzas y covarianzas restringidas)
    • Variaciones iguales para las variables correspondientes en diferentes momentos: por ejemplo, var_x1 = var_y1 var_x2 = var_y2etc.
    • Covarianzas iguales para los puntos de tiempo correspondientes: por ejemplo, cov_x1_x2 = cov_y1_y2 cov_x1_x3 = cov_y1_y3etc.
  • Examine la diferencia de ajuste entre los dos modelos.
    • el modelo 2 está anidado dentro del modelo 1, por lo que debería poder usar pruebas de comparación de modelos anidados como las pruebas de diferencia de chi-cuadrado.
Jeromy Anglim
fuente
2

Probablemente esto se pueda probar con procesos mixtos (bueno, debes asumir la normalidad multivariante). Apila todos los datos en una columna. Luego necesitará indicadores para la identificación del sujeto y para el punto de tiempo. Tendrá que definir tanto el ID de sujeto como el indicador de punto de tiempo como variables de clase. Ajustar un modelo de solo intercepción; luego use quizás una declaración repetida para ajustar una estructura de varianza / covarianza sin restricciones ( type=un). Escriba donde es la probabilidad) y los grados de libertad. Luego ajuste un segundo modelo, pero esta vez en el enunciado repetido, use la opción para ajustar estructuras de covarianza separadas para cada punto de tiempo (es decir, cada punto de tiempo es un grupo). Escriba elL - 2 ln ( L )-2En(L)Lgroup=SAS-2En(L)y df. Luego realice la prueba LRT de no diferencia en ajuste usando la diferencia en -2loglikelihoods y dfs entre los dos modelos, que deben distribuirse chi-cuadrado bajo la hipótesis nula de no diferencia en ajuste entre los dos modelos.

Andres
fuente
Bienvenido al sitio, @Andres. Puedes usar LaTeX aquí. Lo hice en tu publicación para hacerlo un poco más ordenado.
Peter Flom - Restablece a Monica