Estoy leyendo " Una introducción al aprendizaje estadístico ". En el capítulo 2, discuten la razón para estimar una función .
2.1.1 ¿Por qué estimar ?
Hay dos razones principales por las cuales podemos desear estimar f : predicción e inferencia . Discutimos cada uno en su turno.
Lo he leído varias veces, pero todavía no estoy del todo claro sobre la diferencia entre predicción e inferencia. ¿Podría alguien proporcionar un ejemplo (práctico) de las diferencias?
prediction
terminology
causality
usuario61629
fuente
fuente
Respuestas:
Inferencia: dado un conjunto de datos, desea inferir cómo se genera la salida en función de los datos.
Predicción: Dada una nueva medición, desea utilizar un conjunto de datos existente para construir un modelo que elija de manera confiable el identificador correcto de un conjunto de resultados.
Inferencia: Desea averiguar cuál es el efecto de Age, Passenger Class y, Gender en sobrevivir al Titanic Disaster. Puede poner una regresión logística e inferir el efecto que tiene cada característica del pasajero en las tasas de supervivencia.
Predicción: Dada cierta información sobre un pasajero del Titanic, desea elegir entre el conjunto y ser correcto con la mayor frecuencia posible. (Consulte el compromiso de varianza de sesgo para la predicción en caso de que se pregunte cómo ser correcto con la mayor frecuencia posible).{lives,dies}
La predicción no gira en torno al establecimiento de la relación más precisa entre la entrada y la salida, la predicción precisa se preocupa por poner nuevas observaciones en la clase correcta con la mayor frecuencia posible.
Entonces, el 'ejemplo práctico' se reduce a la siguiente diferencia: dado un conjunto de datos de pasajeros para un solo pasajero, el enfoque de inferencia le brinda una probabilidad de sobrevivir, el clasificador le da la opción de elegir entre vidas o morir.
El ajuste de clasificadores es un tema muy interesante y crucial de la misma manera que lo es interpretar correctamente los valores p y los intervalos de confianza.
fuente
En general, al hacer el análisis de datos, imaginamos que existe algún tipo de "proceso de generación de datos" que da lugar a los datos, y la inferencia se refiere al aprendizaje sobre la estructura de este proceso, mientras que la predicción significa ser capaz de pronosticar los datos que provienen de él. . A menudo los dos van juntos, pero no siempre.
Un ejemplo donde los dos van de la mano sería el modelo de regresión lineal simple
fuente
En la página 20 del libro, los autores brindan un hermoso ejemplo que me hizo comprender la diferencia.
Aquí está el párrafo del libro: Introducción al aprendizaje estadístico.
"Por ejemplo , en un entorno inmobiliario, uno puede tratar de relacionar los valores de las viviendas con datos como la tasa de criminalidad, la zonificación, la distancia a un río, la calidad del aire, las escuelas, el nivel de ingresos de la comunidad, el tamaño de las casas, etc. En este caso, uno podría estar interesado en cómo las variables de entrada individuales afectan los precios, es decir, ¿cuánto más valdrá una casa si tiene una vista del río? Este es un problema de inferencia . Alternativamente, uno simplemente podría estar interesado al predecir el valor de una casa dadas sus características: ¿ está esta casa subvalorada o sobrevalorada? Este es un problema de predicción ".
fuente
Ahora, si obtiene los datos sobre ingresos, diga series de ingresos personales disponibles de BEA, y construya la variable de la época del año, puede estimar la función f , luego conecte los últimos valores del ingreso de la población y la época del año en este función. Esto generará la predicción para el próximo trimestre de los ingresos de la tienda.
fuente
Imagínese, usted es médico en una unidad de cuidados intensivos. Usted tiene un paciente con fiebre fuerte y un número determinado de células sanguíneas y un peso corporal dado y cientos de datos diferentes y desea predecir si él o ella va a sobrevivir. Si es así, va a ocultar esa historia sobre su otro hijo a su esposa, si no, es importante que lo revele, mientras pueda.
El médico puede hacer esta predicción basándose en los datos de pacientes anteriores que tenía en su unidad. Basado en su conocimiento de software, puede predecir usando una regresión lineal generalizada (glm) o una red neuronal (nn).
1. Modelo lineal generalizado
Hay muchos parámetros correlacionados para la glm, por lo que para llegar a un resultado, el médico tendrá que hacer suposiciones (linealidad, etc.) y tomar decisiones sobre qué parámetros pueden tener influencia. La glm lo recompensará con una prueba t de importancia para cada uno de sus parámetros para que pueda reunir pruebas sólidas, de que el género y la fiebre tienen una influencia significativa, el peso corporal no necesariamente.
2. red neuronal
La red neuronal tragará y asimilará toda la información que haya en la muestra de pacientes anteriores. No le importará si los predictores están correlacionados y no revelará tanta información sobre si la influencia del peso corporal parece ser importante solo en la muestra en cuestión o en general (al menos no en el nivel de experiencia que el médico tiene que ofrecer). Solo calculará un resultado.
Que es mejor
El método a elegir depende del ángulo desde el que se mire el problema: como paciente, preferiría la red neuronal que utiliza todos los datos disponibles para una mejor suposición sobre lo que me sucederá sin suposiciones fuertes y obviamente erróneas como la linealidad. Como el médico, que quiere presentar algunos datos en una revista, necesita valores p. La medicina es muy conservadora: van a pedir valores p. Entonces, el médico quiere informar que, en tal situación, el género tiene una influencia significativa. Para el paciente, eso no importa, simplemente use cualquier influencia que la muestra sugiera que sea más probable.
En este ejemplo, el paciente quiere predicción, el lado científico del médico quiere inferencia. Principalmente, cuando quieres entender un sistema, entonces la inferencia es buena. Si necesita tomar una decisión donde no puede entender el sistema, la predicción tendrá que ser suficiente.
fuente
No estás solo aquí. Después de leer las respuestas, ya no estoy confundido, no porque entienda la diferencia, sino porque entiendo que está en el ojo del espectador y es inducido verbalmente. Ahora estoy seguro de que esos dos términos son definiciones políticas más que científicas. Tomemos, por ejemplo, la explicación del libro, la que las universidades intentaron usar como buena: "¿cuánto más valdrá una casa si tiene una vista del río? Este es un problema de inferencia". Desde mi punto de vista, esto es absolutamente un problema de predicción. Usted es propietario de una empresa de construcción civil y desea elegir el mejor terreno para construir el próximo conjunto de casas. Tienes que elegir entre dos ubicaciones en la misma ciudad, una cerca del río y la siguiente cerca de la estación de tren. Quieres predecirLos precios para ambos lugares. O quieres inferir . Va a aplicar los métodos exactos de estadística, pero nombra el proceso. :)
fuente
Hay buena actuación de investigación que un fuerte predictor de si los prestatarios pagar sus préstamos es si sentían que utilizan para proteger sus pisos de rasguños hechos por patas de los muebles. Esta variable "sentido" será una ayuda, distinta a un modelo predictivo donde el resultado es pagar por defecto vs. Sin embargo, si los prestamistas quieren obtener una mayor influencia sobre este resultado, que será negligente al pensar que pueden hacerlo mediante la distribución sintió tan ampliamente como sea posible.
"¿Qué tan probable es esto prestatario para pagar?" es un problema de predicción; "¿Cómo puedo influir en el resultado?" es un problema de inferencia causal.
fuente
y = f (x), entonces
predicción (lo que es el valor de Y con un valor dado de x: si el valor específico de x lo que podría ser el valor de Y
inferencia (cómo y cambia con el cambio en x): lo que podría ser el efecto sobre Y si x cambia
Predicción ejemplo: supongamos que Y representan el salario de una persona a continuación, si proporcionamos entrada tal como años de experiencia, grado como variables de entrada a continuación, nuestra función predice el sueldo del empleado.
Inferencia ejemplo: supongamos que el costo de vida cambia entonces cuánto es el cambio en el salario
fuente