Supongamos que tenemos dos puntos (la siguiente figura: círculos negros) y queremos encontrar un valor para un tercer punto entre ellos (cruz). De hecho, vamos a estimarlo en función de nuestros resultados experimentales, los puntos negros. El caso más simple es dibujar una línea y luego encontrar el valor (es decir, interpolación lineal). Si tuviéramos puntos de apoyo, por ejemplo, como puntos marrones en ambos lados, preferimos obtener beneficios de ellos y ajustar una curva no lineal (curva verde).
La pregunta es cuál es el razonamiento estadístico para marcar la cruz roja como la solución. ¿Por qué otras cruces (por ejemplo, las amarillas) no son respuestas donde podrían estar? ¿Qué tipo de inferencia o (?) Nos empuja a aceptar el rojo?
Desarrollaré mi pregunta original basada en las respuestas obtenidas para esta pregunta muy simple.
fuente
Respuestas:
Cualquier forma de ajuste de funciones, incluso las no paramétricas (que generalmente hacen suposiciones sobre la suavidad de la curva involucrada), implica suposiciones y, por lo tanto, un salto de fe.
La antigua solución de la interpolación lineal es una que 'simplemente funciona' cuando los datos que tiene son muy finos 'lo suficiente' (si observa un círculo lo suficientemente cerca, también se ve plano, solo pregúntele a Columbus), y fue factible incluso antes de la era de la computadora (que no es el caso para muchas soluciones de splines modernas). Tiene sentido asumir la creencia de que la función 'continuará en la misma materia (es decir, lineal)' entre los dos puntos, pero no hay una razón a priori para esto (salvo el conocimiento sobre los conceptos en cuestión).
Se vuelve rápidamente claro cuando tiene tres (o más) puntos no colineales (como cuando agrega los puntos marrones arriba), que la interpolación lineal entre cada uno de ellos pronto involucrará esquinas afiladas en cada uno de ellos, lo que generalmente no es deseado. Ahí es donde intervienen las otras opciones.
Sin embargo, sin mayor conocimiento del dominio, no hay forma de afirmar con certeza que una solución es mejor que la otra (para esto, tendría que saber cuál es el valor de los otros puntos, lo que anula el propósito de ajustar la función en el primer lugar).
En el lado positivo, y tal vez más relevante para su pregunta, bajo 'condiciones de regularidad' (lea: supuestos : si sabemos que la función es, por ejemplo, suave), se puede demostrar que tanto la interpolación lineal como las otras soluciones populares son 'razonables' aproximaciones Aún así: requiere supuestos, y para estos, generalmente no tenemos estadísticas.
fuente
Puede calcular la ecuación lineal para la línea de mejor ajuste (p. Ej. Y = 0.4554x + 0.7525), sin embargo, esto solo funcionaría si hubiera un eje etiquetado. Sin embargo, esto no le daría la respuesta exacta solo la más adecuada en relación con los otros puntos.
fuente