Tarifas de aerolíneas: ¿qué análisis se debe utilizar para detectar comportamientos competitivos de fijación de precios y correlaciones de precios?

12

Quiero investigar el comportamiento de fijación de precios de las aerolíneas, específicamente cómo las aerolíneas reaccionan a los precios de la competencia.

Como diría, mi conocimiento sobre análisis más complejos es bastante limitado. He realizado principalmente todos los métodos básicos para obtener una visión general de los datos. Esto incluye gráficos simples que ya ayudan a identificar patrones similares. También estoy usando SAS Enterprise 9.4.

Sin embargo, estoy buscando un enfoque más basado en números.

Conjunto de datos

El conjunto de datos (auto) recopilados que estoy usando contiene alrededor de ~ 54,000 tarifas. Todas las tarifas se cobraron dentro de un período de 60 días, diariamente (todas las noches a las 00:00).Método de recogida

Por lo tanto, cada tarifa dentro de ese intervalo de tiempo ocurre veces sujeta a la disponibilidad de la tarifa, así como a la fecha de salida del vuelo, cuando se pasa por la fecha de cobro de la tarifa. (No puede cobrar una tarifa para un vuelo cuando la fecha de salida del vuelo es anterior)n

El no formateado que se ve básicamente así: (datos falsos)

+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate        | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32    | 16APR2015:10:50:02 | 23APR2015:21:55:04       | XA            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32    | 16APR2015:13:20:02 | 23APR2015:19:00:04       | XY            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32    | 16APR2015:13:20:02 | 23APR2015:21:55:04       | XH            |
+--------------------+-----------+--------------------+--------------------------+---------------+

"DaysBeforeDeparture" se calcula a través de dondeI=sc

  • I e intervalo (días antes de la salida)
  • Fecha y fecha de la tarifa (salida del vuelo)
  • c & fecha de cobro de la tarifa

Aquí hay un ejemplo de conjunto de datos agrupados por I (DaysBeforeDep.) (Datos falsos):

+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 880.68           | 477.99           | 2,245.23         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 904.89           | 477.99           | 2,534.55         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 1,044.39         | 920.99           | 2,119.09         | LH               |
+-----------------+------------------+------------------+------------------+------------------+

Lo que se me ocurrió hasta ahora

Mirando los gráficos de líneas, ya puedo estimar que varias líneas tendrán un factor de correlación alto. Por lo tanto, intenté usar el análisis de correlación primero en los datos agrupados. ¿Pero es esa la forma correcta? Básicamente, ¿ahora trato de hacer correlaciones en los promedios en lugar de los precios individuales? ¿Hay otra manera?

No estoy seguro de qué modelo de regresión se ajusta aquí, ya que los precios no se mueven en ninguna forma lineal y parecen no lineales. ¿Necesitaría adaptar un modelo a cada uno de los desarrollos de precios de una aerolínea

PD: Este es un largo muro de texto. Si necesito aclarar algo, hágamelo saber. Soy nuevo en este submarino.

Alguien una pista? :-)

s1x
fuente

Respuestas:

9

Aviso de un ex analista de gestión de ingresos de la aerolínea: con este enfoque, podría estar ladrando al árbol equivocado. Disculpas por el muro de texto que sigue, pero esta información es mucho más compleja y ruidosa de lo que podría parecer a primera vista, por lo que quería proporcionar una breve descripción de cómo se genera; prevenido vale por dos.

Las tarifas de la aerolínea tienen dos componentes: todas las tarifas reales (completas con las reglas de tarifas y lo que usted tiene) que una aerolínea tiene disponible para una ruta determinada, la mayoría de las cuales se publican en la Compañía de publicación de tarifas aéreas (algunas son de uso especial) no, pero esas son la excepción y no la regla) y la gestión real de inventario realizada por la aerolínea en el día a día.

Las tarifas se pueden enviar a ATPCO cuatro veces al día, a intervalos establecidos, y cuando las aerolíneas lo hacen, generalmente consistirá en una mezcla de adiciones, eliminaciones y modificaciones de las tarifas existentes. Cuando una aerolínea inicia una acción de fijación de precios (suponiendo que sus competidores no estén tratando de hacer sus propios movimientos aquí), generalmente tienen que esperar hasta la próxima actualización para ver si sus competidores siguen / responden. Lo contrario ocurre cuando un competidor inicia una acción de fijación de precios, ya que la aerolínea tiene que esperar hasta la próxima actualización antes de poder responder.

Ahora, todo esto está muy bien con respecto a las tarifas, pero el problema es que, debido a que todo esto se publica en ATPCO, las tarifas son la mejor opción para la información pública ... todos sus competidores pueden ver lo que han entró en su arsenal, por lo que los intentos de ofuscar no son desconocidos, como publicar tarifas a las que nunca se les asignará ningún inventario, enumerar todas las tarifas como día de salida, etc.

En muchos sentidos, la salsa secreta se reduce a la asignación de inventario real, es decir, cuántos asientos en cada vuelo estará dispuesto a vender por una tarifa determinada, y esta información no está disponible públicamente. Puede obtener algunas vislumbres raspando información web, pero las posibles combinaciones de hora / fecha de salida y las reglas de tarifas son bastante numerosas y pueden escalar rápidamente más allá de su capacidad de realizar un seguimiento fácil.

Por lo general, una aerolínea solo estará dispuesta a vender un puñado de asientos por una tarifa muy baja y las personas que se enganchan a ellos tienen que reservar con bastante anticipación para que las reglas de la tarifa no los bloqueen, o que otros viajeros simplemente los golpeen. La aerolínea estará dispuesta a vender algunos asientos más por una tarifa más alta, y así sucesivamente. Estarán encantados de vender todos los asientos por la tarifa más alta que hayan publicado, pero esto no suele ser factible.

Lo que está viendo con las tarifas cada vez más altas cuanto más se acerca al día de salida es simplemente el proceso natural de hacer que los asientos baratos se reserven más lejos, mientras que el inventario restante gradualmente se vuelve más caro. Por supuesto, hay algunas advertencias aquí. El proceso de RM se gestiona activamente y la intervención humana es bastante común, ya que el equipo de RM generalmente se esfuerza por cumplir sus objetivos de ingresos y maximizar los ingresos en cada vuelo. Como tal, los vuelos que se llenan rápidamente pueden "ajustarse" cerrando las tarifas bajas. Los vuelos que están reservando lentamente pueden "aflojarse" asignando más asientos a tarifas más bajas.

Hay una constante interacción y competencia entre las compañías aéreas en esta área, pero no es muy probable que capture la dinámica real solo con las tarifas de raspado. No me malinterpreten, teníamos tales herramientas a nuestra disposición y, a pesar de sus limitaciones, eran bastante valiosas, pero solo eran una fuente de datos que alimentaba el proceso de toma de decisiones. Necesitaría acceso a los cientos, si no miles de decisiones operativas tomadas por los equipos de RM a diario, así como a la información sobre el estado del mundo tal como la ven en ese momento. Si no puede encontrar una aerolínea asociada con la que trabajar para obtener estos datos, es posible que deba considerar fuentes de datos alternativas.

Recomiendo buscar acceso a los datos de tarifas de O&D de la Guía oficial de la aerolínea (o uno de sus competidores) e intentar usar eso para su análisis. Está basado en muestras (aproximadamente el 10% de todos los boletos vendidos) y está agregado a un nivel más alto de lo que sería ideal, por lo que es imprescindible una cuidadosa selección de ruta (recomendaría algo con muchas aerolíneas, volando sin parar varias veces al día, con aviones grandes), pero es posible que pueda tener una mejor idea de lo que se vendió realmente (tarifa promedio) y cuánto se vendió (factor de carga), en comparación con lo que está disponible para la venta en un momento dado. Con esa información, podría estar en mejores condiciones para al menos explorar los resultados de la estrategia de precios de las aerolíneas y hacer sus inferencias a partir de ahí.

habu
fuente
Gracias por tu explicación detallada. Estoy de acuerdo con usted en que dicho análisis basado en precios solo es bastante limitado. Esto también incluye reglas de tarifas notables (boletos reembolsables, estadía mínima, etc.). Algunas de esas limitaciones se pueden superar al recopilar siempre las mismas tarifas para hacer las comparables. Sin embargo, una información importante, como mencionó, falta la cantidad de asientos disponibles (¡puede ser! = Asientos en un avión) y la cantidad real de boletos vendidos.
s1x
El acceso a dichos datos es muy limitado y está desactualizado (por ejemplo, Databank 1B de US DOT). Algunas investigaciones como Clark R. y Vincent N. (2012) El enlace de fijación de precios [...] contingente a la capacidad incluye dichos datos y ofrecen una visión mucho mejor. Soy consciente de las limitaciones (con suerte ;-)) y, como mencionó, hay mucha más información que influye en los precios. Aún así, al observar un mercado específico, puede tener una idea de lo que sucede. Puede ver si hay algún comportamiento competitivo y diferentes enfoques de estrategia de precios. Sin embargo, nunca podrás encontrar la causa.
s1x
1
@ s1x: estoy de acuerdo y desearía tener una alternativa sólida para ofrecer, pero, como usted mismo aprendió, los datos detallados de ingresos son el secreto más celosamente guardado en cualquier aerolínea. Solo quería asegurarme de que esté al tanto de eso y de lo que implica el proceso de generación de datos. Más allá de eso, me gusta lo que estás tratando de hacer y creo que la otra respuesta es un paso en la dirección correcta, en cuanto a la técnica. Si puedo sugerir, también puede echar un vistazo al uso de la correlación cruzada entre sus diversos TS durante la exploración de datos, ya que a menudo es valioso para discernir patrones entre TS vinculados.
habu
4

Además del análisis exploratorio de datos (EDA), tanto descriptivo como visual, trataría de utilizar el análisis de series de tiempo como un análisis más completo y sofisticado . Específicamente, realizaría análisis de regresión de series de tiempo . El análisis de series de tiempo es un gran campo de investigación y práctica, por lo que, si no está familiarizado con los fundamentos, sugiero comenzar con el artículo de Wikipedia vinculado anteriormente, buscar gradualmente temas más específicos y leer los artículos, documentos y libros correspondientes.

Dado que el análisis de series de tiempo es un muy popular enfoque, que es apoyada por la mayoría de código abierto y comercial de código cerrado la ciencia de datos y estadísticas ambientes (software) , tales como R , Python , SAS , SPSS y muchos otros. Si desea utilizar R para esto, consulte mis respuestas sobre el análisis general de series de tiempo y sobre la clasificación y agrupación de series de tiempo . Espero que esto sea útil.

Aleksandr Blekh
fuente
Gracias por su respuesta @ Aleksandr Blekh, realmente apreciado. Me cavaré en eso. Tal vez sea una pregunta estúpida, pero corríjame aquí si me equivoco aquí: un análisis de correlación, mientras usa una línea aérea como la variable con la que se correlaciona. Los resultados fueron convincentes hasta ahora, ya que algunas aerolíneas, especialmente. los que tenían acuerdos de código compartido tenían precios similares. Serían correlaciones tan altas, por ejemplo: ColumnUA(LH) 0.90435 <.0001 ColumnSQ 0.32544 <.0001 ColumnAF(DL) 0.55336 <.0001 supongo que tales resultados indican patrones de precios similares. Con un análisis de regresión, ¿qué averiguaría?
s1x
@ s1x: De nada (siéntase libre de votar / aceptar, si valora la respuesta y, por supuesto, cuando obtendrá la reputación suficiente para hacerlo). Ahora, a tu pregunta. Como dije, el análisis TS es más sofisticado y completo. En particular, la regresión de TS explica las llamadas autorregresiones y otras complejidades de TS. Por lo tanto, mi sugerencia de usar el análisis de regresión TS en lugar del análisis tradicional más simple. Además, siempre debe comenzar con EDA, sin importar qué análisis de datos planee realizar (en realidad, EDA a menudo cambiará sus planes).
Aleksandr Blekh