¿La frecuencia alélica observada es significativamente menor que la predicha?

10

Pregunta : ¿Cómo puedo construir una prueba para determinar si la frecuencia observada de "montaña" -alele (Fig. 1) es significativamente menor en las montañas del centro al sur de lo previsto (Fig. 2) por el modelo de selección ecológica ( ver más abajo para más detalles )?

Problema : Mi pensamiento inicial fue hacer una regresión de los residuos del modelo contra la latitud: longitud y altitud (lo que da como resultado que la interacción entre la latitud y la longitud sea tan significativa). El problema es que los residuos (Fig. 3) pueden reflejar variaciones no explicadas por el modelo y / o que esto es algo biológico, por ejemplo, el alelo no ha tenido tiempo de extenderse hacia el sur a su potencial o hay alguna barrera para el flujo de genes. Si compara las frecuencias de alelos de montaña observadas (Fig. 1) versus esperadas (Fig. 2), existe una diferencia obvia, especialmente en las montañas del centro al sur de Suecia y Noruega. Acepto que el modelo puede no explicar toda la variación, pero ¿puedo hacer una prueba razonable para explorar la idea de que el alelo de montaña no ha alcanzado su potencial en las montañas del centro al sur?

Antecedentes: Tengo un marcador AFLP bieélico cuya distribución de frecuencia parece estar asociada con hábitats de montaña (y latitud: longitud) versus hábitats de tierras bajas en la península escandinava (Fig. 1). La "montaña" -allele está casi fija en el norte, que es montañosa. Está casi ausente o arreglado para el "valle de las tierras bajas" en el sur, que carece de montañas. A medida que uno se mueve de norte a sur en las montañas, la "montaña" -llele ocurre con menor frecuencia. Esta diferencia en la frecuencia de la "montaña" de norte a sur puede deberse simplemente a filogeografía o procesos históricos, ya que la región fue colonizada tanto por el norte como por el sur. Por ejemplo, si el alelo de montaña se origina en la población del norte, tal vez no haya tenido tiempo de expandirse completamente en la población del sur,

Mi hipótesis de trabajo es que la frecuencia completa de "montaña" es el resultado de una selección ecológica (la hipótesis nula es una selección neutral).

Para mi modelo de selección ecológica, he utilizado un modelo aditivo generalizado (GAM) con la frecuencia del alelo binomial como variable de respuesta (129 sitios muestreados en Fennoscandinavia con típicamente de 10 a 20 individuos muestreados en cada sitio) y varias variables climáticas y de estación de crecimiento como Las variables predictoras. Los resultados del modelo son los siguientes (TMAX04-06 = temperatura máxima en abril-junio, Phen_NPPMN = productividad media de la vegetación en la estación de crecimiento, PET_HE_YR = evapotranspiración potencial anual, Dist_Coast = distancia a la costa):

Family: binomial 
Link function: logit 

Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) + 
s(PET_HE_YR) + s(Dist_Coast)

Parametric coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -0.74372    0.04736   -15.7   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Approximate significance of smooth terms:
             edf Ref.df Chi.sq  p-value    
s(TMAX_04)    3.8100  4.812 25.729 9.43e-05 ***
s(TMAX_05)    0.8601  1.000  5.887  0.01526 *  
s(TMAX_06)    0.8862  1.000  7.644  0.00569 ** 
s(Phen_NPPMN) 6.2177  7.375 39.028 3.16e-06 ***
s(PET_HE_YR)  3.1882  4.147 18.039  0.00145 ** 
s(Dist_Coast) 2.2882  2.857  9.725  0.01906 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

R-sq.(adj) =  0.909   Deviance explained = 89.7%
REML score = 326.73  Scale est. = 1         n = 129

ingrese la descripción de la imagen aquí

Figura 1. Frecuencia observada de "montaña" para el marcador AFLP bi-alélico. Líneas de contorno de 0.1 intervalos de frecuencia, el sombreado de color es altitud con azules para los más bajos y rojos para los más altos.

ingrese la descripción de la imagen aquí

Figura 2. Frecuencia predicha de "montaña" para el marcador AFLP bi-alélico. Líneas de contorno de 0.1 intervalos de frecuencia, el sombreado de color es altitud con azules para los más bajos y rojos para los más altos.

ingrese la descripción de la imagen aquí

Figura 3. Residuos del modelo de selección ecológica (utilizando GAM) desglosados ​​por toda el área de estudio (Fennoscandinavia) y por separado para Noruega, Suecia y Finlandia. Las líneas discontinuas rojas representan una zona de contacto secundaria entre las poblaciones del norte y del sur inferidas de otros marcadores AFLP y el análisis de isótopos estables de plumas cultivadas en sus áreas de invernada separadas en África. La delgada línea punteada negra es el centro de la zona.

Keith Larson
fuente
1
Gracias por la gran cantidad de detalles. ¿Cómo entra en cuestión el modelo nulo? Parece que solo el modelo de selección ecológica es importante para comparar lo observado con lo esperado.
gui11aume
¿Cuál es su información real aquí? El resultado del modelo dice "n = 129", pero ¿son 129 individuos, o 129 ubicaciones en cada una de las cuales tiene frecuencias alélicas, o ...?
parada 01 de
Lo siento, quería proporcionar la mayor cantidad de antecedentes posible para permitirles a todos comprender mejor la lógica (o ilógica) de mi enfoque para el manuscrito que estoy desarrollando. Mi pregunta se encuentra en la parte superior, me gustaría encontrar un motivo para determinar si la diferencia entre lo observado y lo esperado es significativamente diferente. Esto podría informarme si el alelo todavía se está extendiendo o si hay alguna barrera para alcanzar el valor esperado. En cuanto a la "N = 129", como esta es una frecuencia de alelos, esto significa 129 sitios con típicamente entre 10 y 20 individuos muestreados en cada sitio.
Keith Larson
Usted menciona que los individuos parecen ser panmícticos para los loci maternos y automsomales. ¿Tienes acceso a estos datos? ¿Cómo evaluaste la panmixia?
Sameer

Respuestas:

1

Esta pregunta puede estar muerta, pero los gráficos aquí son magníficos, y la respuesta aquí se siente intuitivamente obvia. Si está buscando un alelo de "montaña", la opción obvia sería utilizar la altitud (o algún sustituto de ella) como su predictor. Si eso mostrara una asociación significativa con la frecuencia de alelos, proporcionaría una fuerte evidencia de su hipótesis.

Puede agregar más variables predictoras que describan otros aspectos de la montaña además de su altitud, por ejemplo, la "rugosidad" del terreno o el tipo de vegetación, que son excepcionalmente montañosos y también pueden estar asociados con la frecuencia de los alelos.

Michael K
fuente