Además de algunas circunstancias únicas en las que debemos comprender absolutamente la relación media condicional, ¿cuáles son las situaciones en las que un investigador debería elegir OLS en lugar de la Regresión Cuantil?
No quiero que la respuesta sea "si no sirve de nada entender las relaciones de cola", ya que podríamos usar la regresión mediana como el sustituto de OLS.
Respuestas:
Si está interesado en la media, use MCO, si está en la mediana, use cuantil.
Una gran diferencia es que la media se ve más afectada por los valores atípicos y otros datos extremos. A veces, eso es lo que quieres. Un ejemplo es si su variable dependiente es el capital social en un vecindario. La presencia de una sola persona con mucho capital social puede ser muy importante para todo el vecindario.
fuente
Parece haber una confusión en la premisa de la pregunta. En el segundo párrafo dice: "podríamos usar la regresión mediana como el sustituto de OLS". Tenga en cuenta que la regresión de la mediana condicional en X es (una forma de) regresión cuantil.
Si el error en el proceso de generación de datos subyacente se distribuye normalmente (lo que puede evaluarse verificando si los residuos son normales), entonces la media condicional es igual a la mediana condicional. Además, cualquier cuantil en el que pueda estar interesado (p. Ej., El percentil 95 o el percentil 37) puede determinarse para un punto dado en la dimensión X con los métodos estándar de OLS. El principal atractivo de la regresión cuantil es que es más robusto que OLS. La desventaja es que si se cumplen todos los supuestos, será menos eficiente (es decir, necesitará un tamaño de muestra más grande para lograr la misma potencia / sus estimaciones serán menos precisas).
fuente
Referencias
fuente
Peter Flom tuvo una respuesta excelente y concisa, solo quiero expandirla. La parte más importante de la pregunta es cómo definir "peor".
Para definir peor, necesitamos tener algunas métricas y la función para calcular qué tan buenas o malas son las conexiones llamadas funciones de pérdida.
Podemos tener diferentes definiciones de la función de pérdida, y no hay correcto o incorrecto en cada definición, pero diferentes definiciones satisfacen diferentes necesidades. Dos funciones de pérdida bien conocidas son la pérdida al cuadrado y la pérdida de valor absoluto.
Si utilizamos la pérdida al cuadrado como una medida de éxito, la regresión cuantil será peor que la MCO. Por otro lado, si usamos la pérdida de valor absoluto, la regresión cuantil será mejor.
Cuál es la respuesta de Peter Folm:
fuente
Si desea estimar la media, no puede obtenerla de la regresión cuantil.
Si desea estimar la media y los cuantiles con suposiciones mínimas (pero más suposiciones que la regresión cuantil) pero tiene más eficiencia, use la regresión ordinal semiparamétrica. Esto también le brinda probabilidades de excedencia. Un estudio de caso detallado se encuentra en mis notas del curso de RMS, donde se muestra en un conjunto de datos que el error medio de estimación absoluta promedio sobre varios parámetros (cuantiles y media) se logra mediante regresión ordinal. Pero solo para estimar la media, OLS es mejor y para estimar cuantiles, la regresión cuantil fue la mejor.
fuente