¿Puedo usar bootstrapping, por qué o por qué no?

10

Actualmente estoy trabajando en estimaciones de biomasa usando imágenes satelitales. Definiré rápidamente los antecedentes de mi pregunta y luego explicaré la pregunta estadística en la que estoy trabajando.

Antecedentes

Problema

Estoy tratando de estimar la biomasa sobre un área en Francia. Mi respuesta es la densidad de volumen de la madera de vapor (en ), que es más o menos proporcional a la biomasa (dependiendo de las densidades de la madera ...).m3/ha

Las variables independientes que tengo son índices de vegetación derivados de reflejos medidos sobre esta área (el satélite utilizado en el estudio es MODIS para quienes lo conocen). Estos índices son, por ejemplo, NDVI, EVI, etc. Tengo mapas de los índices y la resolución de los mapas es de 250 m.

Existen fuertes correlaciones entre estos índices y el volumen en un mismo tipo de bosque (bioma y clima). Así que estoy tratando de hacer retroceder la densidad de volumen con respecto a estos indicadores (en realidad, sus series de tiempo) en las gráficas de inventario donde conozco el volumen.

Inventarios forestales

El volumen en estas parcelas se estima con el siguiente método de muestreo:

  1. Los nodos de inventario se colocan en una cuadrícula regular que cubre el área.
  2. Se adjunta una parcela a cada nodo, y el proceso de inventario (tipos de árboles, volúmenes, altura del dosel, etc.) ocurre en esta parcela. Por supuesto, solo estoy interesado en el gráfico de inventario y los valores de mis índices de vegetación son el valor del píxel que contiene el gráfico.
  3. El proceso de inventario en una parcela es el siguiente:

    http://i.stack.imgur.com/DeHdC.png

    • Medida de los árboles que tienen un diámetro> 37.5cm en el círculo de radio de 15m.
    • Medida de los árboles que tienen un diámetro> 22.5cm en el círculo de radio de 9m.
    • Medida de los árboles que tienen un diámetro> 7.5 cm en el círculo de radio de 6 m.

La densidad de volumen se calcula utilizando factores de expansión.

Para cada parcela tengo acceso a los datos de todos los árboles medidos.

Además, para cada árbol individual, tengo una incertidumbre sobre el volumen debido al uso de ecuaciones alométricas (digamos 10%).

Donde las estadísticas son importantes ...

Para que mis regresiones sean más precisas, necesito para cada estimación de volumen la varianza / IC de esta medida. Esto depende, en mi opinión, del número de árboles muestreados y de la densidad de volumen encontrada.

Entonces tengo dos problemas:

  1. ¿Cómo explicar el hecho de que mis índices de vegetación se miden en un píxel de 250 m?

    Puedo suponer que la densidad de volumen es constante en un píxel y que muestro este píxel con un gráfico de inventario.

  2. ¿Cómo estimar la variabilidad de mi densidad de volumen?

    Creo que podría usar bootstrapping en la población de árboles. Pero mi número total de árboles medidos puede ser bastante pequeño (de 7 a 20 ...). Además, ¿cómo puedo tener en cuenta el hecho de que estoy midiendo los árboles en diferentes círculos según su tamaño? ¿Y cómo debería cambiar la variabilidad si estoy mirando un píxel completo?

También estaba pensando que podría usar una simulación de Monte Carlo para simular un bosque, y luego muestrear este bosque al azar con parcelas para ver qué está pasando ...

No tengo una sólida base estadística, ¡así que estoy un poco perdido!

Thomas C.
fuente

Respuestas:

1

No entiendo muy bien sus datos, pero puedo decirle que una alternativa al arranque multinomial que funciona mejor para eventos raros es la perturbación / arranque salvaje. La perturbación es extremadamente flexible y a menudo es capaz de manejar datos que no son iid, sin embargo, a veces se necesita mucha delicadeza para aproximar correctamente el cdf. Si logra especificar correctamente la fórmula de arranque, hará menos suposiciones y probablemente sea menos sesgado que el método de suavizado sugerido anteriormente, particularmente dado su escaso conjunto de datos, lo que puede hacer que las estimaciones de densidad sean inestables.

invitado47
fuente
0

Si tuviera que abordar este problema, primero comenzaría por:

  1. mirando un mapa de los datos de origen
  2. Intentando algún tipo de suavizado 2D en la superficie, intenta informarlo con AIC
  3. calcule la derivada de la suavidad en la ubicación y relacione la variación en la entrada con la variación en la salida utilizando el método delta
  4. Compare los resultados de esto con algunos valores "conocidos" para verificar / validar el enfoque

Enlaces relevantes: http://www.stanford.edu/class/cme308/notes/TaylorAppDeltaMethod.pdf http://www.ingentaconnect.com/content/klu/stco/2010/00000020/00000004/00009140?crawler=true

Estudiante
fuente