Me gustaría obtener intervalos de confianza del 95% para los centroides basados en la similitud de Gower entre algunas muestras mulivariadas (datos de la comunidad de núcleos de sedimentos). Hasta ahora he usado el vegan{}
paquete en R para obtener una similitud de Gower modificada entre los núcleos (basado en Anderson 2006; ahora incluido en R como parte de vegdist()
). ¿Alguien sabe cómo puedo calcular los intervalos de confianza del 95% para los centroides de, por ejemplo, los sitios de muestreo, en función de la similitud modificada de Gower?
Además, si es posible, me gustaría trazar estos IC del 95% en un PCO que muestre los centroides, por lo que es evidente si se superponen.
Para obtener una similitud de Gower modificada, utilicé:
dat.mgower <- vegdist(decostand(dat, "log"), "altGower")
Pero hasta donde yo sé, no obtienes centroides vegdist()
. Necesito obtener centroides, luego IC del 95%, luego trazarlos ... en R. ¡Ayuda!
Anderson, MJ, KE Ellingsen y BH McArdle. 2006. Dispersión multivariante como medida de la diversidad beta. Ecology Letters 9: 683–693.
fuente
Respuestas:
No tengo claro de inmediato qué centroide desea, pero el centroide que me viene a la mente es el punto en el espacio multivariado en el centro de la masa de los puntos por grupo. Sobre esto, desea una elipse de confianza del 95%. Ambos aspectos se pueden calcular utilizando la
ordiellipse()
función en vegano . Aquí hay un ejemplo modificado de?ordiellipse
pero usando un PCO como un medio para integrar las diferencias en un espacio euclidiano del cual podemos derivar centroides y elipses de confianza para grupos basados en la variable de Gestión de la NaturalezaManagement
.Ahora mostramos los primeros 2 ejes PCO y agregamos una elipse de confianza del 95% basada en los errores estándar del promedio de las puntuaciones de los ejes. Queremos establecer los errores estándar
kind="se"
y utilizar elconf
argumento para proporcionar el intervalo de confianza requerido.Tenga en cuenta que capturo la salida de
ordiellipse()
. Esto devuelve una lista, un componente por grupo, con detalles del centroide y la elipse. Puede extraer elcenter
componente de cada uno de estos para llegar a los centroidesObserve que el centroide es solo para la solución 2d. Una opción más general es calcular los centroides usted mismo. El centroide es solo los promedios individuales de las variables o, en este caso, los ejes PCO. A medida que trabaja con las diferencias, deben integrarse en un espacio de ordenación para que tenga ejes (variables) de los que pueda calcular promedios. Aquí los puntajes de los ejes están en columnas y los sitios en filas. El centroide de un grupo es el vector de promedios de columna para el grupo. Hay varias formas de dividir los datos, pero aquí utilizo
aggregate()
para dividir los puntajes en los primeros 2 ejes PCO en grupos basadosManagement
y calcular sus promediosEsto da:
que es lo mismo que los valores almacenados
stats
como extraídos anteriormente. Elaggregate()
enfoque generaliza a cualquier número de ejes, por ejemplo:Obviamente, los centroides en los dos primeros ejes PCO no cambian cuando pedimos más ejes, por lo que puede calcular los centroides sobre todos los ejes una vez, luego usar cualquier dimensión que desee.
Puede agregar los centroides a la gráfica anterior con
La trama resultante ahora se verá así
Finalmente, vegan contiene las funciones
adonis()
ybetadisper()
que están diseñadas para observar las diferencias en los medios y las variaciones de los datos multivariados de manera muy similar a los documentos / software de Martí.betadisper()
está estrechamente relacionado con el contenido del documento que cita y también puede devolverle los centroides.fuente
?ordiellipse
para obtener detalles de lo que se está haciendo aquí, especialmente al calcular el intervalo de confianza. Si la teoría coincide con los datos es algo que quizás desee analizar con simulación o remuestreo o algo más que confiar en la "teoría".adonis()
se puede usar para probar medias similares (centroides) de grupos como se podría usar ANOVA en el caso univariante. Se usa una prueba de permutación para determinar si los datos son consistentes con la hipótesis nula de que no hay diferencia de centroides. Tenga en cuenta también que las diferencias de los centroides pueden ser causadas por diferentes dispersiones de grupo (varianzas).betadisper()
puede ayudarlo a probar si ese es el caso, nuevamente usando una prueba basada en permutación de las distancias promedio de los puntos de muestra a su centroide.adonis()
ybetadisp()
creo), solo estaba buscando una buena manera de mostrar los datos. Tengo cierta interacción sitio x temporada para un diseño de medidas repetidas, así que quería poder mostrar fácilmente qué sitios mostraron un efecto estacional. Creo que estas elipses son lo que estoy buscando; Este ejemplo fue muy útil.ordiellipse()
sin incrustar un bucle for? Tengo ambas estaciones y sitios en mis datos, y quería mostrar sitios de diferencias en una parcela y estaciones en otra codificándolos por colores. Por alguna razón, el uso de col = c (1,2,1,2), etc. no funciona, ni col = as.numeric (cent ["Site_TP"]). ¿Hay alguna forma elegante de hacer esto?