¿Los estadísticos del sector privado intentan determinar la causalidad?

12

Los economometristas académicos a menudo están interesados ​​en determinar la causalidad. Parece que todos los trabajos de ciencias de datos / estadísticas del sector privado que conozco solo buscan modelos predictivos.

¿Hay algún trabajo en el sector privado (o en el gobierno) que investigue la causalidad?

Genial38
fuente
55
Siempre que queramos hacer una intervención, usted apuesta que nos importa. Piense en todas las pruebas A / B que hace Google para hacer un cambio de diseño simple.
Matthew Drury el
8
Por supuesto. Casi cualquier caso legal depende en última instancia de cuestiones de causalidad. Casi cualquier esquema de control de calidad decente está relacionado con la causalidad. A los ingenieros y científicos les importa mucho.
whuber
66
Otra pregunta clásica del sector privado es: "¿Mis anuncios generan más ventas?"
Matthew Gunn el
2
@MatthewGunn: +1. En general: "¿Este cambio (costoso) hará alguna diferencia?" Asumir que una empresa necesita mantenerse a flote (y posiblemente prosperar) tener un cierto grado de comprensión de la dinámica causal de su mercado es crucial.
usεr11852
44
Inicialmente me abstuve de convertir este hilo a CW, creyendo que es posible que se pueda ofrecer una respuesta autorizada basada en datos / hechos. Como no está resultando así, por varias razones que muchos pueden encontrar interesantes y útiles, lo he convertido a CW. ¡Gracias a todos por sus contribuciones!
whuber

Respuestas:

15

Soy un economista en tecnología que trabaja en la inferencia causal con datos experimentales defectuosos o de observación. La mayoría de las principales firmas tecnológicas tendrán personas como yo haciendo investigación aplicada sobre precios, marketing y diseño de productos. También hay equipos de políticas públicas en algunas empresas.

También hay muchas personas que trabajan en la experimentación web. Este es un grupo mucho más grande.

Finalmente, también hay tipos particulares de consultoría económica, particularmente antimonopolio, donde este es el foco principal.

Dimitriy V. Masterov
fuente
7

[Las primeras cinco respuestas emocionales censuradas.]

Esa es una de las preguntas más extrañas en el sitio, francamente. Y muestra cuánta desconexión hay entre lo que dicen tus profesores y la vida real, es decir, la vida fuera de la torre de marfil. Es bueno que lo estés mirando ... pero tú (es decir, estudiantes de doctorado en economía) definitivamente necesitas hacer esto con más frecuencia.

Sí, hay trabajos fuera de la academia donde las personas (sorpresa, sorpresa) usan métodos de inferencia causal. Y (sorpresa, sorpresa) publicar artículos. Mis respuestas son específicas de EE. UU., Pero estoy seguro de que puede encontrar organizaciones similares en otros países.

  • Ejemplo 1 (solo porque lo conozco internamente en mi trabajo). Trabajo en una subsidiaria de una gran organización de investigación por contrato, Abt Associates . Emplea a unas 2.300 personas en 50 países, y la mayoría de ellas trabajan en la realización o el apoyo de investigaciones de evaluación y en la implementación de intervenciones. Jacob Klerman, uno de los 6 técnicos principales (conocidos como Senior Fellows ), es el editor de Evaluation Review, supervisando una junta de editores de los cuales aproximadamente 5/6 tienen afiliaciones académicas. Entonces ese es un ejemplo del sector privado para usted. (Revise los anuncios de posición de la compañía para ver específicamente qué tipo de habilidades puede estar buscando una compañía como esa; no estoy completamente seguro de que todos se anuncien en JOE, ya que es costoso; puedo nombrar fácilmente otra docena en los EE. UU. Que sería feliz contratar a un artesano econométrico.)
  • Ejemplo 2 (Tengo una familiaridad pasajera con eso porque conozco personas que comenzaron este proyecto desde otros lugares): What Works Clearinghouseen el Departamento de Educación federal de EE. UU. es un sitio web dedicado al metanálisis del análisis publicado de programas educativos. WWC opera a través de una red de revisores que reciben instrucciones específicas sobre lo que se considera un estudio que tiene el rigor suficiente para respaldar las afirmaciones causales, y lo que no. Resulta que la mayor parte de esa investigación publicada es una mierda absoluta. Como en, mierda. Sin grupo de control. No se verifica el balance de las covariables demográficas / equivalencia de referencia. Solo alrededor del 3-5% de los estudios (publicados en la literatura de revisión por pares, por amor de Dios) "cumplen con los estándares sin reservas", lo que significa que tenían cierta apariencia de aleatorización, deserción controlada y contaminación cruzada de los brazos del experimento, e hizo el análisis de una manera más o menos aceptable en el futuro. (Según el teorema de Bayes, cuando escuche a alguien decir: "Pero lo vi publicado que el chicle aumenta el rendimiento matemático", puede responder "BS", y estaría en lo cierto el 90% del tiempo.) En cualquier caso, esto es un federal proyecto de departamento, así que ese es un ejemplo para usted donde una agencia gubernamental revisa el uso adecuado de las herramientas de inferencia causal. (Ponga su nombre en el sombrero como revisor del estudio, esta será una gran experiencia educativa para usted. Si estuviera enseñando evaluación de programas, habría hecho de esto un requisito para mis estudiantes). (Para bioestadísticos que trabajan con la FDA, donde usted tiene que enviar su código de análisis antes de recopilar datos, los estándares de WWC siguen siendo muy laxos). d tener razón más del 90% del tiempo.) En cualquier caso, este es un proyecto del departamento federal, por lo que es un ejemplo para usted donde una agencia gubernamental revisa el uso adecuado de las herramientas de inferencia causal. (Ponga su nombre en el sombrero como revisor del estudio, esta será una gran experiencia educativa para usted. Si estuviera enseñando evaluación de programas, habría hecho de esto un requisito para mis estudiantes). (Para bioestadísticos que trabajan con la FDA, donde usted tiene que enviar su código de análisis antes de recopilar datos, los estándares de WWC siguen siendo muy laxos). d tener razón más del 90% del tiempo.) En cualquier caso, este es un proyecto del departamento federal, por lo que es un ejemplo para usted donde una agencia gubernamental revisa el uso adecuado de las herramientas de inferencia causal. (Ponga su nombre en el sombrero como revisor del estudio, esta será una gran experiencia educativa para usted. Si estuviera enseñando evaluación de programas, habría hecho de esto un requisito para mis estudiantes). (Para bioestadísticos que trabajan con la FDA, donde usted tiene que enviar su código de análisis antes de recopilar datos, los estándares de WWC siguen siendo muy laxos).
StasK
fuente
No creo que los profesores de economía digan que no usas métodos causales en la práctica (nadie comienza una conversación con "aquí hay algunos métodos estadísticos que a nadie le importará"), sino que al estudiante le preocupa que la inferencia causal sea solo un marfil tema de la torre (como la estimación de densidad de cóncavo logarítmico: le aseguro que nadie en la industria hace eso, y por una buena razón). Tampoco está claro cómo el ejemplo 2 muestra a las personas en la industria que utilizan métodos causales.
Cliff AB
@CliffAB El OP solicitó ejemplos de la industria y el gobierno, por lo que el # 2 se ajusta a la ley. También creo que el punto de StasK sobre el escaso conocimiento de la vida fuera de la torre de marfil entre los estudiantes de doctorado en economía y, en menor medida, sus profesores, es bastante preciso, aunque hay mucha heterogeneidad en los campos y departamentos e incluso en el tiempo.
Dimitriy V. Masterov
@ DimitriyV.Masterov: # 2 parece un ejemplo de no usar las herramientas causales adecuadas. Y leí (tal vez leí mal) la respuesta de StasK que implica que los profesores dicen "nadie fuera de los académicos usa métodos causales". Si un profesor que se especializa en métodos causales dice esto, está admitiendo el fracaso; si está creando métodos estadísticos aplicados que nadie fuera del mundo académico utiliza, eso no se considera algo bueno. La teoría estadística es, por supuesto, una historia diferente.
Cliff AB
Mi lectura (de nuevo, quizás una lectura errónea) de la pregunta del OP es que los profesores les dicen "¡las estadísticas causales son importantes!", Y su respuesta es "¿es realmente importante? ¿La gente de la industria realmente utiliza estos métodos?". Pero de nuevo, tal vez estoy leyendo mal.
Cliff AB
1
@CLIFF WWCH revisa la investigación académica, separando el trigo de la paja en cuanto a la inferencia causal, por lo que en realidad es un gran ejemplo de un área donde los estándares son más altos en el gobierno que en algunas partes de la academia.
Dimitriy V. Masterov
6

En las estadísticas farmacéuticas y en varios campos relacionados, el vínculo causal entre la intervención y el resultado de salud es la pregunta clave de interés al decidir si se debe utilizar una intervención. Hay una amplia gama de subcampos, como ensayos aleatorios (clínicos o preclínicos), ensayos no aleatorios o de un solo brazo, ejercicios de laboratorio, metanálisis, vigilancia de la seguridad de los medicamentos basada en informes espontáneos de eventos adversos, epidemiología (incluyendo ideas como la aleatorización de Mandelian) y la investigación de efectividad (por ejemplo, utilizando datos de observación como bases de datos de reclamaciones de seguros). Por supuesto, en los experimentos aleatorios diseñados (como los ensayos clínicos aleatorios) atribuir causalidad es algo más fácil que en algunas de las otras aplicaciones.

Björn
fuente
Supongo que un entorno de desarrollo de medicamentos sería uno de los pocos lugares donde las personas se preocupan por la mejoría de las personas en lugar de si mejoran, porque en última instancia, debe 'estar seguro' en toda la población. - Entonces, definitivamente es una buena respuesta, pero como mencionas, un caso bastante especial.
Dennis Jaheruddin
4

Soy investigador en A Place for Mom, el servicio de referencia para personas mayores más grande del país. Hemos diseñado una encuesta destinada a comprender cómo mudarse a una comunidad de vida asistida influye en la calidad de vida. La inferencia causal es fundamental para esta investigación, y los métodos de análisis causal (p. Ej., Emparejamiento, modelado de procesos de selección, estimación de los efectos promedio del tratamiento) son esenciales.

Equilibrio impetuoso
fuente
-3

En la mayoría de las situaciones del sector privado no le importará la causalidad.

En la práctica, a pesar del uso típico del lenguaje, las personas están mucho más interesadas en un impacto bien entendido que en una causalidad (bien entendida).

Desde un punto de vista académico, es muy interesante saber:

Si hago A, por eso el resultado será B

Pero desde un punto de vista práctico, en casi todas las situaciones, lo siguiente es lo que la gente realmente quiere saber:

Si hago A, el resultado será B

Claro que puede estar interesado en el impacto de A, pero si es realmente la causa o si hay una causa oculta que simplemente crea esta correlación generalmente no es tan interesante.

Nota sobre limitaciones

Puede pensar: está bien, pero si no sabemos que A causa B, entonces es muy arriesgado trabajar en esa suposición.

Esto es cierto en cierto modo, pero nuevamente en la práctica solo te preocupará: ¿Funcionará o hay excepciones?

Para ilustrar esto, puede notar que esta situación:

Si hago A, en la situación X, debido a A el resultado será B y debido a X el resultado se desviará por delta

No es mucho más útil que esta situación (suponiendo que pueda cuantificar los impactos por igual):

Si hago A, en la situación X, el resultado será B y el resultado se desviará por delta

Ejemplo simple: correlación para causar

  • A: reponer aceite de motor
  • B: reducción de la falla del freno
  • C: chequeo del auto

La lógica: C siempre causa A y B

Relación resultante: si A sube, B sube pero no hay relación causal entre A y B.

Mi punto: puede modelar el impacto de A en B. A no causa B, pero el modelo seguirá siendo correcto, y si tiene información sobre A, tendrá información sobre B.

La persona interesada en la falla del freno con información sobre A solo se preocupará por conocer la relación de A con B, y solo se preocupará si la relación es correcta, independientemente de si esta relación es causal o no.

rev. Dennis Jaheruddin
fuente
1
Supongo que no soy el único confundido por su distinción entre "causa" e "impacto". Sus ejemplos parecen aclararlo un poco: quitar los detalles de la cadena causal podría no ser especialmente importante. Comprar más anuncios de costo por clic provocará un aumento en las ventas, no importa cómo, y eso es lo que le importa a su cliente.
Scortchi - Restablece a Monica
@Scortchi Lo que quiero decir con causa: 'Si A, entonces por eso B'. Lo que quiero decir con impacto (quizás no sea la definición más típica, pero no se trata del lenguaje): 'Si A entonces B'. - Ejemplo de libro de texto de una diferencia relevante: C causa A y B. Por lo tanto, A no causa B, pero diría que tendría sentido modelar el impacto de A sobre B. - Después de releer mi propio comentario, tal vez 'impacto 'podría ser reemplazado por' relación real con retraso de tiempo '.
Dennis Jaheruddin
55
No creo estar de acuerdo con el ejemplo publicitario: si necesito decidir si comprar más anuncios en línea, me importa si hacerlo generará más ventas que no comprar estos anuncios (ya sea a través de más clics u otros significa = causalidad), que puede ser algo diferente de si las compañías que aumentaron su publicidad en línea en el último año tuvieron mayores aumentos de ventas que las compañías que no lo hicieron (correlación). La causalidad no se trata de los medios exactos por los cuales se produce el resultado (sería bueno saberlo, por supuesto), sino más bien si algo ocurre debido a hacer o no hacer A.
Björn
66
ABAB
No creo estar de acuerdo con este comentario, aunque en mi experiencia es algo cierto, no se busca la causalidad, aunque en muchos problemas debería. En la práctica, veo esto como casi equivalente a la distinción entre modelos predictivos y modelos explicativos.
Thomas Speidel