Pido disculpas de antemano si esta pregunta está mal planteada: soy astrónomo, no estadístico. Mi pregunta está dirigida específicamente a ayudarme a descubrir si los procesos gaussianos son una técnica apropiada para mi problema.
Utilizando un telescopio y un espectrógrafo alimentado con fibra, mi proyecto ha tomado el espectro óptico de una galaxia en muchos lugares. El patrón de muestreo para un solo apunte está en la primera imagen, y se repite tres veces en total, con diferentes desplazamientos espaciales, para llenar los espacios (segunda imagen). Idealmente, me gustaría construir estimaciones de ciertas cantidades sobre una cuadrícula que cubre la galaxia.
Mi método ingenuo sería analizar el espectro de cada fibra por separado, de modo que tuviera puntos de estimación de las cantidades de interés, y luego construir un proceso gaussiano para estimar esas cantidades en todas partes. Del mismo modo, podría construir un proceso gaussiano para los espectros en sí, luego analizar el GP en mi cuadrícula de elección para encontrar las cantidades que me interesan. Sin embargo, no estoy seguro de que este sea un enfoque válido, ya que mis observaciones son no discreto, sino que coinciden.
A diferencia de, por ejemplo, los científicos del suelo, que pueden tomar muestras de tierra desde una ubicación muy discreta, y luego alejarse 50 metros y repetir, mis observaciones se superponen espacialmente, por lo que me estoy integrando sobre toda la luz que emite una galaxia. No es obvio para mí que se me permita descuidar cualquier variación espacial que pueda existir dentro de una medida dada. En otras palabras, ¿es un proceso gaussiano incluso válido cuando las ubicaciones de muestreo individuales no son pequeñas? ¿Puedo construir un término espacial adicional para explicar la "mezcla" ligera dentro de una sola fibra?
Anexo: Tradicionalmente, los espectros solo se interpolan, se vuelven a muestrear en una cuadrícula y luego se analizan, lo que también me parece extremadamente incorrecto, pero si voy a llover en los desfiles de colegas, al menos quiero presentar un método alternativo.
fuente
Hay un tema en geoestadística llamado Reducción de escala exacta. El objetivo principal aquí es estimar una propiedad a una escala menor que las observaciones. Además, estas observaciones pueden superponerse o no (realmente no importa). Por favor, eche un vistazo a este documento: http://www.ccgalberta.com/ccgresources/report07/2005-101-exact_reproduction.pdf
En este documento, muestran un método para reducir las observaciones utilizando técnicas geoestadísticas. Muestran que al calcular correctamente las covarianzas cruzadas entre diferentes escalas de datos (punto frente a bloque), la estimación de kriging sigue siendo válida; tal que el promedio de los valores estimados a menor escala es igual a datos de entrada más grandes. Básicamente, para calcular los valores estimados en cualquier escala, solo necesita calcular la función de covarianza entre los datos de entrada, las escalas objetivo y las correlaciones cruzadas correctamente. En el Proceso Gaussiano, la suposición es que la estimación se realiza en la misma escala que las observaciones de entrada.
Entonces estos son los pasos: 1- Calcule el variograma experimental a partir de sus datos.
2- Ajuste el modelo de variograma a su variogama experiencial. Es posible que deba tener en cuenta la anisotropía direccional aquí. Esta es la función de covarianza que en GP se calcula mediante el método de máxima verosimilitud.
3- Calcular todas las covarianzas y covarianzas cruzadas entre los datos de entrada y la escala objetivo. Hay recibos numéricos para este paso. La idea es que al discretizar los bloques en puntos finitos, puede calcular la covarianza promedio. Los datos de superposición deben tenerse en cuenta aquí.
4- realiza Kriging y calcula los valores estimados.
GP es un tema muy relacionado con la geoestadística. Sin embargo, la geoestadística no se limita a los procesos gaussianos. Existen muchos otros métodos para estimar o simular un proceso aleatorio.
fuente