Para un intervalo de predicción en regresión lineal, todavía usa para generar el intervalo. También usa esto para generar un intervalo de confianza de . ¿Cuál es la diferencia entre los dos?E[Y| x0]
80
Para un intervalo de predicción en regresión lineal, todavía usa para generar el intervalo. También usa esto para generar un intervalo de confianza de . ¿Cuál es la diferencia entre los dos?E[Y| x0]
Respuestas:
Tu pregunta no es correcta. Un intervalo de confianza proporciona un rango para , como usted dice. Un intervalo de predicción da un rango para . Naturalmente, nuestra mejor suposición para es , por lo que los intervalos se centrarán en el mismo valor, .Y y E [ y | x ] x βE [ y∣ x ] y y E[y∣x] xβ^
Como dice @Greg, los errores estándar serán diferentes --- suponemos que el valor esperado de más preciso de lo que estimamos . Estimar requiere incluir la varianza que proviene del término de error verdadero.y yE[y∣x] y y
Para ilustrar la diferencia, imagine que podríamos obtener estimaciones perfectas de nuestros coeficientes . Entonces, nuestra estimación de sería perfecta. Sin embargo, todavía no estaríamos seguros de qué sí era porque hay un cierto término de error que hay que tener en cuenta. Nuestro "intervalo" de confianza sería solo un punto porque estimamos exactamente correcto, pero nuestro intervalo de predicción sería más amplio porque tomamos en cuenta el verdadero término de error.E [ y ∣ x ] y E [ y ∣ x ]β E[y∣x] y E[y∣x]
Por lo tanto, un intervalo de predicción será más amplio que un intervalo de confianza.
fuente
La diferencia entre un intervalo de predicción y un intervalo de confianza es el error estándar.
El error estándar para un intervalo de confianza en la media tiene en cuenta la incertidumbre debida al muestreo. La línea que calculó a partir de su muestra será diferente de la línea que se habría calculado si hubiera tenido toda la población, el error estándar tiene en cuenta esta incertidumbre.
El error estándar para un intervalo de predicción en una observación individual tiene en cuenta la incertidumbre debido al muestreo como el anterior, pero también tiene en cuenta la variabilidad de los individuos en torno a la media pronosticada. El error estándar para el intervalo de predicción será más amplio que para el intervalo de confianza y, por lo tanto, el intervalo de predicción será más amplio que el intervalo de confianza.
fuente
La siguiente explicación me pareció útil:
Fuente: http://www.graphpad.com/support/faqid/1506/
fuente
Uno es una predicción de una observación futura, y el otro es una respuesta media pronosticada. Daré una respuesta más detallada para, con suerte, explicar la diferencia y de dónde viene, así como cómo esta diferencia se manifiesta en intervalos más amplios para la predicción que para la confianza.
Esperemos que esto aclare un poco por qué el intervalo de predicción es siempre más amplio y cuál es la diferencia subyacente entre los dos intervalos. Este ejemplo fue adaptado de Faraway, Linear Models con R, Sec. 4.1.
fuente
Respuesta corta:
Un intervalo de predicción es un intervalo asociado con una variable aleatoria aún por observar (pronóstico).
Un intervalo de confianza es un intervalo asociado con un parámetro y es un concepto frecuente.
Verifique la respuesta completa aquí de Rob Hyndman, el creador del paquete de pronóstico en R.
fuente
Esta respuesta es para aquellos lectores que no pudieron entender completamente las respuestas anteriores. Discutamos un ejemplo específico. Suponga que intenta predecir el peso de las personas a partir de su estatura, sexo (hombre, mujer) y dieta (estándar, baja en carbohidratos, vegetariana). Actualmente, hay más de 8 mil millones de personas en la Tierra. Por supuesto, puede encontrar miles de personas con la misma altura y otros dos parámetros pero con un peso diferente. Sus pesos difieren enormemente porque algunos de ellos tienen obesidad y otros pueden sufrir de inanición. La mayoría de esas personas estarán en algún lugar en el medio.
Una tarea es predecir el peso promedio de todas las personas que tienen los mismos valores de las tres variables explicativas. Aquí usamos el intervalo de confianza. Otro problema es pronosticar el peso de alguna persona específica. Y no sabemos las circunstancias de vida de ese individuo. Aquí se debe usar el intervalo de predicción. Se centra en el mismo punto, pero debe ser mucho más amplio que el intervalo de confianza.
fuente