Un instrumento utilizado para medir los niveles de glucosa en la sangre de una persona se controla en una muestra aleatoria de 10 personas. Los niveles también se miden utilizando un procedimiento de laboratorio muy preciso. La medida del instrumento se denota por x. La medida del procedimiento de laboratorio se denota por y.
Personalmente, creo que y en x es más correcto porque la intención es utilizar las lecturas del instrumento para predecir las lecturas de laboratorio. Y y en x minimiza los errores de tales predicciones.
Pero la respuesta proporcionada fue x en y.
[self-study]
etiqueta.Respuestas:
Muchos documentos de laboratorio, especialmente los experimentos de prueba de instrumentos, aplican dicha regresión x on y.
Argumentan que a partir de la recopilación de datos en el experimento, las condiciones y se controlan, y obtienen x de la lectura del instrumento (introduciendo algún error). Este es el modelo físico original del experimento, por lo que el error x ~ y + es más adecuado.
Para minimizar el error del experimento, a veces, y siendo controlado en la misma condición, entonces x se mide varias veces (o experimento repetido). Este procedimiento puede ayudarlo a comprender la lógica detrás de ellos y encontrar el error x ~ y + más claramente.
fuente
fuente
Predicción y pronóstico
Sí, tiene razón, cuando ve esto como un problema de predicción, una regresión Y-sobre-X le dará un modelo tal que, dada una medición por instrumentos, puede hacer una estimación imparcial de la medición de laboratorio precisa, sin realizar el procedimiento de laboratorio. .
Esto puede parecer contrario a la intuición porque la estructura de error no es la "real". Suponiendo que el método de laboratorio es un método estándar sin errores de oro, entonces "sabemos" que el verdadero modelo generador de datos es
Explícitamente, sin pérdida de generalidad podemos dejar
Análisis de instrumentos
La persona que le hizo esta pregunta, claramente no quería la respuesta anterior, ya que dice que X-on-Y es el método correcto, entonces, ¿por qué podrían haber querido eso? Lo más probable es que estuvieran considerando la tarea de comprender el instrumento. Como se discutió en la respuesta de Vincent, si desea saber acerca de cómo quieren que se comporte el instrumento, X-on-Y es el camino a seguir.
Volviendo a la primera ecuación anterior:
Contracción
Ejemplo en R Una forma de tener una idea de lo que está sucediendo aquí es hacer algunos datos y probar los métodos. El siguiente código compara X-on-Y con Y-on-X para la predicción y la calibración, y puede ver rápidamente que X-on-Y no es bueno para el modelo de predicción, pero es el procedimiento correcto para la calibración.
Las dos líneas de regresión se trazan sobre los datos.
Y luego el error de suma de cuadrados para Y se mide para ambos ajustes en una nueva muestra.
Alternativamente, se puede generar una muestra en una Y fija (en este caso 4) y luego el promedio de esas estimaciones tomadas. Ahora puede ver que el predictor Y-on-X no está bien calibrado con un valor esperado mucho más bajo que Y. El predictor X-on-Y, está bien calibrado con un valor esperado cercano a Y.
La distribución de las dos predicciones se puede ver en una gráfica de densidad.
fuente
Depende de sus suposiciones sobre la varianza de X y la varianza de Y para los mínimos cuadrados ordinarios. Si Y tiene la única fuente de varianza y X tiene varianza cero, entonces use X para estimar Y. Si los supuestos son al revés (X tiene la única varianza e Y tiene varianza cero), entonces use Y para estimar X.
Si se supone que tanto X como Y tienen varianza, entonces es posible que deba considerar los mínimos cuadrados totales .
Una buena descripción de TLS se escribió en este enlace . El documento está orientado al comercio, pero la sección 3 hace un buen trabajo al describir TLS.
Edición 1 (10/09/2013) ========================================= ======
Originalmente supuse que se trataba de algún tipo de problema de tarea, por lo que no fui muy específico acerca de "la respuesta" a la pregunta del OP. Pero, después de leer otras respuestas, parece que está bien ser un poco más detallado.
Citando parte de la pregunta del OP:
"... Los niveles también se miden utilizando un procedimiento de laboratorio muy preciso ..."
La declaración anterior dice que hay dos mediciones, una del instrumento y otra del procedimiento de laboratorio. La afirmación también implica que la varianza para el procedimiento de laboratorio es baja en comparación con la varianza del instrumento.
Otra cita de la pregunta del OP es:
".... La medida del procedimiento de laboratorio se denota por y ....."
Entonces, de las dos afirmaciones anteriores, Y tiene la varianza más baja. Entonces, la técnica menos propensa a errores es usar Y para estimar X. La "respuesta proporcionada" fue correcta.
fuente