Estoy evaluando dos (2) refrigerantes (gases) que se usaron en el mismo sistema de refrigeración. Tengo datos de temperatura de succión saturada ( ), temperatura de condensación ( ) y amperaje ( ) para la evaluación. Hay dos (2) conjuntos de datos; Primer refrigerante ( ) y segundo refrigerante ( ). Estoy usando un modelo polinómico lineal, multivariante ( & ) de 3er orden para los análisis de regresión. Me gustaría determinar cuánto menos / más amperaje (o, alguna medida similar como comparación de rendimiento) en promedio, como porcentaje, está siendo extraído por el segundo refrigerante.
Mi primer pensamiento fue:
- Determine el modelo a usar:
- Derive los coeficientes ( ) de los datos de línea de base ( ).
- Usando esos coeficientes, para cada & en el conjunto de datos , calcule cada amperaje esperado ( ) y luego el promedio.
- Compare el promedio con el de promedio real ( ) de los datos .
Sin embargo, dado que el segundo refrigerante tiene propiedades térmicas ligeramente diferentes y se realizaron pequeños cambios en el sistema de refrigeración (TXV y ajustes de sobrecalentamiento), no creo que este 'método de comparación de referencia' sea exacto.
Mi siguiente pensamiento fue hacer dos (2) análisis de regresión separados:
y luego, para la temperatura de succión saturada ( ), compare los coeficientes ( vs ) así:
Sin embargo, nuevamente, estos coeficientes deben ponderarse de manera diferente. Por lo tanto, los resultados serían sesgados.
Creo que podría usar una prueba z para determinar qué tan ponderados están los coeficientes, pero no estoy seguro de entender completamente el significado de la salida: . Pero eso todavía no me daría una métrica de rendimiento, que es el objetivo general.
fuente
Respuestas:
De la ley de gas ideal aquí , , lo que sugiere un modelo proporcional. Asegúrese de que sus unidades estén en temperatura absoluta. Pedir un resultado proporcional implicaría un modelo de error proporcional. Considere, quizás , entonces para la regresión lineal múltiple se puede usar tomando los logaritmos de los valores Y, D y S, de modo que esto se parezca a , donde los subíndices significan "logaritmo de". Ahora, esto puede funcionar mejor que el modelo lineal que está utilizando, y las respuestas son entonces tipo de error relativo.PV=nRT Y=aDbSc ln(Y)=ln(a)+bln(D)+cln(S) Yl=al+bDl+cSl l
Para verificar qué tipo de modelo usar, pruebe uno y verifique si los residuos son homoscedastic. Si no lo son, entonces tiene un modelo sesgado , luego haga algo más como modelar los logaritmos, como arriba, uno o más recíprocos de datos x o y, raíces cuadradas, cuadratura, exponenciación, etc., hasta que los residuos sean homoscedastic. Si el modelo no puede arrojar residuos homoscedasticos, utilice la regresión lineal múltiple de Theil, con censura si es necesario.
La forma en que normalmente se distribuyen los datos en el eje y no es necesaria, pero los valores atípicos pueden distorsionar notablemente los resultados de los parámetros de regresión. Si no se puede encontrar la homocedasticidad, entonces no se deben usar mínimos cuadrados ordinarios y se debe realizar algún otro tipo de regresión, por ejemplo, regresión ponderada, regresión de Theil, mínimos cuadrados en x, regresión de Deming, etc. Además, los errores no deben correlacionarse en serie.
El significado de la salida: , puede o no ser pertinente. Esto supone que la varianza total es la suma de dos varianzas independientes. En otras palabras, la independencia es la ortogonalidad (perpendicularidad) en una gráfica . Es decir, la variabilidad total (varianza) sigue el teorema de Pitágoras, , que puede o no ser el caso de sus datos. Si ese es el caso, entonces la estadística es una distancia relativa, es decir, una diferencia de medias (una distancia), dividida por Pitágoras, vector AKA, suma de error estándar (SE), que son desviaciones estándar (SD) divididas porz=(a1−b1)/SE2a1+SE2b1)−−−−−−−−−−−√ x,y H=+A2+O2−−−−−−−√ z N−−√ , donde los SE son ellos mismos distancias. Dividiendo una distancia por la otra, luego las normaliza, es decir, la diferencia de medias dividida por el error total (estándar), que luego se presenta de forma tal que uno puede aplicar ND (0,1) para encontrar una probabilidad.
Ahora, ¿qué sucede si las medidas no son independientes y cómo se puede probar? Puede recordar por geometría que los triángulos que no están en ángulo recto agregan sus lados como , si no refresca tu memoria aquí . Es decir, cuando hay algo más que un ángulo de 90 grados entre los ejes, tenemos que incluir cuál es ese ángulo en el cálculo de la distancia total. Primero recuerde qué es la correlación, covarianza estandarizada. Esto para la distancia total y la correlación convierte enC2=A2+B2−2ABcos(θ),θ=∠(A,B) σT ρA,B σ2T=σ2A+σ2B−2σAσBρA,B . En otras palabras, si sus desviaciones estándar están correlacionadas (por ejemplo, en pares), no son independientes.
fuente