¿Es incorrecto reformular "1 de cada 80 muertes es causada por un accidente automovilístico" ya que "1 de cada 80 personas muere como resultado de un accidente automovilístico?"

56
  • Declaración Uno (S1): "Una de cada 80 muertes es causada por un accidente automovilístico".
  • Declaración Dos (S2): "Una de cada 80 personas muere como resultado de un accidente automovilístico".

Ahora, personalmente no veo mucha diferencia entre estas dos declaraciones. Al escribir, los consideraría intercambiables para un público lego. Sin embargo, ahora dos personas me han cuestionado sobre esto y estoy buscando una perspectiva adicional.

Mi interpretación predeterminada de S2 es: "De 80 personas extraídas uniformemente al azar de la población humana, esperaríamos que una de ellas muriera como resultado de un accidente automovilístico", y considero que esta declaración calificada es equivalente a S1.

Mis preguntas son las siguientes:

  • P1) ¿Es mi interpretación predeterminada equivalente a la Declaración Uno?

  • P2) ¿Es inusual o imprudente que esta sea mi interpretación predeterminada?

  • P3) Si cree que S1 y S2 son diferentes, de modo que para indicar el segundo cuando uno significa que el primero es engañoso / incorrecto, ¿podría proporcionar una revisión completa de S2 que sea equivalente?

Dejemos de lado la objeción obvia de que S1 no se refiere específicamente a muertes humanas y supongamos que eso se entiende en contexto. Dejemos de lado cualquier discusión sobre la veracidad de la afirmación en sí misma: tiene el propósito de ser ilustrativa.

Lo mejor que puedo decir es que los desacuerdos que he escuchado hasta ahora parecen centrarse en el incumplimiento de diferentes interpretaciones de la primera y segunda declaración.

Para el primero, mis retadores parecen interpretarlo como 1/80 * num_deaths = número de muertes causadas por accidentes automovilísticos, pero por alguna razón, el valor predeterminado es una interpretación diferente del segundo en la línea de "si tiene algún conjunto de 80 personas, una de ellas se mueren en un accidente de tráfico"(que obviamente no es una reclamación equivalente). Creo que, dada su interpretación de S1, su valor predeterminado para S2 sería leerlo como (1/80 * num_dead_people = número de personas que murieron en un accidente automovilístico == número de muertes causadas por un accidente automovilístico). No estoy seguro de por qué la discrepancia en la interpretación (su valor predeterminado para S2 es una suposición mucho más fuerte), o si tienen algún sentido estadístico innato que de hecho me falta.

defectuoso_ramas
fuente
19
"Si tienes un grupo de 80 personas, una de ellas morirá en un accidente automovilístico". Si es así como entienden esa afirmación, entonces tengo un chiste extremadamente antiguo sobre 1 de cada 3 niños chinos que dicen que son absolutamente va a amor .
Steve Jessop
3
Esto es muy similar a la diferencia entre prevalencia e incidencia . Como otros señalaron "es causado" se relaciona con algún estado terminado, y "muere" se relaciona con el presente o el futuro.
Sextus Empiricus
55
S2 no deja en claro que los otros 79 murieron. Algunos o todos los otros 79 podrían estar vivos. S1 dice "1 de cada 80 muertes", lo que deja en claro que todos los 80 del grupo murieron.
Michael Chernick
55
Como laico, sin conocer el contexto, interpretaría S1 como: "de todas las causas de muerte para la población X, 1/80 se debe a accidentes automovilísticos", mientras que S2 me dice: "de todas las personas involucradas en accidentes automovilísticos, 1 de cada 80 muere por ello ".
Gnudiff
55
(S2): "Una de cada 80 personas muere como resultado de un accidente automovilístico". me parece ambiguo ¿Es esa una de cada 80 personas que tienen accidentes automovilísticos , o una de cada 80 personas?
Bill the Lizard

Respuestas:

67

En primer lugar, mi primer pensamiento intuitivo fue: "S2 solo puede ser igual a S1 si la tasa de mortalidad por tráfico se mantiene constante, posiblemente durante décadas", lo que ciertamente no habría sido una buena suposición en las últimas décadas. Esto ya insinúa que una dificultad radica en los supuestos temporales implícitos / tácitos.

Yo diría que tus declaraciones tienen la forma

x populationevent

En S1, la población son muertes, y la especificación temporal implícita es en la actualidad o "en un período adecuadamente grande [para tener números de casos suficientes] pero no en un marco de tiempo demasiado amplio [para tener características de accidentes automovilísticos aproximadamente constantes] alrededor del presente"

En S2, la población son personas. Y otros parecen leer esto no como "personas moribundas" sino como "personas vivas" (que, después de todo, es lo que la gente hace con mayor frecuencia / más tiempo). Si lees a la población como personas vivas, claramente, ninguna de cada 80 personas que viven ahora muere "ahora" de un accidente automovilístico. Así que eso se lee como "cuando están muriendo [posiblemente dentro de décadas], la causa de la muerte es un accidente automovilístico".

Mensaje para llevar a casa: siempre tenga cuidado de deletrear quiénes son su población y el denominador de las fracciones en general. (Gerd Gigerenzer tiene documentos sobre no explicar el denominador como una causa importante de confusión, particularmente en estadísticas y comunicación de riesgos).

cbeleites apoya a Monica
fuente
1
"En S1, la población son muertes, y la especificación temporal implícita es en la actualidad o" en un tiempo adecuadamente grande [para tener suficientes números de casos] pero no en un marco de tiempo demasiado amplio [para tener características de accidentes automovilísticos aproximadamente constantes] alrededor del presente "- Al considerar todas las respuestas (maravillosas) que he recibido, creo que esto es lo más importante del asunto. Me sorprendió doblemente la gran variedad de formas en que las personas pueden hacer la segunda declaración, y muchas han abierto mi ojos a esas interpretaciones, pero esta es la especificación estadística de la que carecía mi declaración original
faulty_ram_sticks
faulty_ram_sticks: Gracias por las flores :-) Y estas dos posibles especificaciones de población que hice a partir de S2 no son las únicas, por ejemplo, podría especificar en la línea de respuesta de @ PeterShor una población de personas nacidas en algún momento y seguir eso uno (longitudinalmente). Y así.
cbeleites apoya a Monica el
@cbeleites flores? que flores : - /
El Gran Pato
1
También podría señalar que el uso de "las muertes son causadas" y "la gente muere " también es confuso / mala redacción. Siento que al describir una estadística debería ser "las muertes fueron causadas" y "la gente ha muerto". Eso hace que sea inequívoco que esté describiendo un evento pasado en lugar de hacer una predicción. Por supuesto, también se podría decir que "la gente morirá" para decir que la estadística da crédito a la predicción de que un cierto porcentaje de la población actual morirá por accidentes automovilísticos. Doy estos ejemplos aquí para referencia futura ya que no son una respuesta en sí mismos.
El gran pato el
Pero decir que se causa un porcentaje de muertes me confunde porque eso describe el presente como si el evento estuviera ocurriendo en este momento o algo así. Si lo viera, lo consideraría una redacción deficiente, pero probablemente no leería mucho. Sin embargo, dado que esta es una discusión sobre la redacción, sentí que debería mencionarlo.
El gran pato el
80

Para mí, "1 de cada 80 muertes ..." es, con mucho, la declaración más clara. El denominador en su "1 en 80" es el conjunto de todos los eventos de muerte y esa declaración lo hace explícito.

Hay ambigüedad en la formulación "1 de cada 80 personas ...". Realmente quiere decir "1 de cada 80 personas que mueren ...", pero la declaración puede interpretarse tan fácilmente como "1 de cada 80 personas que ahora viven ..." o similar.

Estoy totalmente de ser explícito sobre el conjunto de referencia en aserciones de probabilidad o frecuencia como esta. Si habla de la proporción de muertes, diga "muertes", no "personas".

Brent Hutto
fuente
31
"" 1 de cada 80 personas que mueren ... ", dado que no existe la inmortalidad, podemos asumir con seguridad que el conjunto de personas que morirán es el mismo conjunto que todas las personas. Necesitaría un calificador adicional, por ejemplo "personas que morirán el próximo año "
MSalters
16
@Msalters Las declaraciones están en tiempo presente, por lo que afirman un reclamo sobre la tasa actual.
Acumulación
66
Técnicamente, creo que "1 de cada 80 personas" es más específico, porque hay muchas más muertes que muertes de personas: muertes de pájaros, muertes de bacterias, muertes de pedantería, ...
Kimball
2
@Pere: No lo sé, sigue, estás diciendo lo mismo de cuando dije the 1/80 ratio does focus on the present time in particular. ¿O estoy malentendido?
Flater
3
(En la nota de posible ambigüedad) Desde la perspectiva del idioma inglés; Creo que un malentendido más común (y más grave) sería leer S2 en el sentido de "1 de cada 80 personas que tienen un accidente automovilístico, morirán en ese accidente" (es decir, "1 de cada 80 accidentes automovilísticos son fatales") - lo cual es un reclamo muy diferente.
Bilkokuya
43

Depende de si estás describiendo o prediciendo .

"1 de cada 80 personas morirá en un accidente automovilístico" es una predicción. De todas las personas vivas hoy, en algún momento de su vida restante, una de cada 80 morirá de esa manera.

"1 de cada 80 muertes son causadas por un accidente automovilístico" es una descripción. De todas las personas que murieron en un período determinado (por ejemplo, el lapso de tiempo de un estudio de apoyo), 1 de cada 80 falleció en un accidente automovilístico.

Tenga en cuenta que la ventana de tiempo aquí es ambigua. Una oración implica que las muertes ya han ocurrido; el otro implica que ocurrirán algún día. Una oración implica que su población de referencia son las personas que han muerto (y que estaban vivas antes de eso); el otro implica una población básica de personas que están vivas hoy (y que eventualmente morirán).

Estas son en realidad declaraciones completamente diferentes, y solo una de ellas probablemente sea compatible con sus datos de origen.

En una nota al margen, la ambigüedad surge de un desajuste entre el estado de ser una persona (que ocurre continuamente) y el evento de morir (que ocurre en un momento determinado). Cada vez que combinas cosas de esta manera obtienes algo que es igualmente ambiguo. Puede resolver instantáneamente la ambigüedad utilizando dos eventos en lugar de un estado y un evento; por ejemplo, "De cada 80 personas que nacen, 1 muere en un accidente automovilístico".

John Wu
fuente
1
Además de ser una predicción, podría interpretarse extrañamente como una amenaza. Leer esta respuesta me hizo pensar en el xkcd relevante .
Comodín el
3
"Hoy, una de cada 80 muertes es causada por un accidente automovilístico. Pero dada la rápida mejora en la tecnología de vehículos y carreteras, y el cambio gradual a otros modos de transporte, esperamos que disminuya a uno de cada 120 para el año 2050, y uno de cada 150 para 2100. En consecuencia, de las personas que viven hoy, solo uno de cada 135 morirá en un accidente automovilístico ".
Michael Kay
21

Las dos declaraciones son diferentes debido al sesgo de muestreo, ya que es más probable que ocurran accidentes automovilísticos cuando las personas son jóvenes.

Hagamos esto más concreto al plantear un escenario poco realista.

Considere las dos declaraciones:

  • La mitad de todas las muertes son causadas por un accidente automovilístico.
  • La mitad de todas las personas vivas hoy morirán en un accidente automovilístico.

Mostraremos que estas dos declaraciones no son lo mismo.

Simplifiquemos mucho las cosas y supongamos que todos los nacidos morirán de un ataque cardíaco a los 80 años o de un accidente automovilístico a los 40 años. Además, supongamos que la primera afirmación anterior es válida y que estamos en una población en estado estacionario, así que las muertes equilibran los nacimientos. Luego habrá tres poblaciones de humanos, todas igualmente grandes.

  • Personas menores de 40 años que morirán de un accidente automovilístico.
  • Personas menores de 40 años que morirán de un ataque al corazón.
  • Personas mayores de 40 años que morirán de un ataque al corazón.

Estas tres poblaciones tienen que ser igualmente grandes, porque la tasa de personas que mueren en accidentes automovilísticos (de la primera población anterior) y la tasa de personas que mueren en ataques cardíacos (de la tercera población anterior) son iguales.

1/401/40

Entonces, en este caso, solo un tercio de todas las personas vivas hoy morirán en un accidente automovilístico, por lo que las dos declaraciones no son lo mismo.

En la vida real, mi impresión es que los accidentes automovilísticos ocurren a una edad significativamente menor que la mayoría de las otras causas de muerte. Si este es el caso, habrá una diferencia sustancial entre los números en su estado de cuenta uno y dos.

Si modificó la segunda declaración a

  • La mitad de todas las personas nacidas morirán en un accidente automovilístico,

entonces, bajo el supuesto de una población en estado estable, las dos declaraciones serían equivalentes. Pero, por supuesto, en el mundo real no tenemos una población en estado estable, y un argumento similar (aunque más complicado) muestra que para una población en crecimiento o en disminución, el sesgo de muestreo aún hace que estas dos afirmaciones sean diferentes.

Peter Shor
fuente
"Estas tres poblaciones tienen que ser igualmente grandes, porque la tasa de personas que mueren en ataques cardíacos (de la primera población de arriba) y la tasa de personas que mueren en ataques cardíacos (de la tercera población de arriba) son iguales". ¿Crees que podrías hacer esto un poco más obvio? (Además, supongo que se refiere a accidentes automovilísticos para la primera población) De lo contrario, este es un gran ejemplo. Ni siquiera había considerado que podría haber una diferencia entre "La mitad de todas las personas nacidas" y "La mitad de todas las personas vivas".
faulty_ram_sticks
@faulty_ram_sticks. Sí: el sesgo de muestreo puede ser complicado. Lo he explicado con más detalle ... Espero que esto sea lo suficientemente bueno ahora. Y gracias por atrapar mi error tipográfico.
Peter Shor
55
Esta es una maravillosa pregunta de sesgo de muestreo. El hecho de que las primeras 8 respuestas no captaron el sesgo de muestreo muestra que esto es realmente complicado. Puedo usarlo cuando enseño probabilidad.
Peter Shor
Muy bien construido, argumento claro, y el que no solo invalida teóricamente la intuición de equivalencia del OP de una manera que probablemente ni siquiera pensó.
Peter - Restablece a Monica el
12

¿Es mi interpretación predeterminada equivalente a la Declaración Uno?

No.

Digamos que tenemos 800 personas. 400 murieron: 5 de un accidente automovilístico, los otros 395 olvidaron respirar. S1 ahora es verdadero: 5/400 = 1/80. S2 es falso: 5/800! = 1/80.

El problema es que técnicamente S2 es ambiguo porque no especifica cuántas muertes hubo en total, mientras que S1 sí. Alternativamente, S1 tiene una información más (muertes totales) y una información menos (personas totales). Tomados al pie de la letra, describen diferentes proporciones.

¿Es inusual o imprudente que esta sea mi interpretación predeterminada?

De hecho, no estoy de acuerdo con tu interpretación, pero creo que no importa. Probablemente, el contexto haría obvio lo que significa.

  • Por un lado, obviamente todas las personas mueren, por lo tanto, está implícito que total de personas = total de muertes. Entonces, si está discutiendo las tasas de mortalidad en general, se aplica su interpretación predeterminada.
  • Por otro lado, si está discutiendo un conjunto de datos limitado en el que no es un hecho que todos mueran, mi interpretación anterior es más precisa. Pero no parece difícil para el lector pasar por alto esto.

Puede preguntar dónde podría encontrarse con personas que no mueren. Por un lado, podríamos estar trabajando con un conjunto de datos estadísticos que solo rastrea a las personas durante 5 años, por lo que los que aún están vivos al final del estudio deben ignorarse, ya que no se sabe de qué morirán. Alternativamente, la causa de la muerte puede ser desconocida, en cuyo caso realmente no se puede asignar a automóviles o no a automóviles.

Si piensa que S1 y S2 son diferentes, de modo que para indicar el segundo cuando uno significa que el primero es engañoso / incorrecto, ¿podría proporcionar una revisión completa de S2 que sea equivalente?

"Una de cada 80 personas que muere, lo hace como resultado de un accidente automovilístico". lo que equivale a reformular S1.

Cloons
fuente
yy
Pero eso fue solo una nota al margen. Lo que quería decir es que esta respuesta solo señala un problema semántico, pero le falta el problema estadístico que se refiere a la situación de que la probabilidad de que una muerte se deba a un accidente automovilístico no es constante independientemente del tiempo. Esto lo hace diferente cuando nos referimos a 'es causado' (el pasado) y '(morirá)' (el presente o el futuro).
Sextus Empiricus
"Causa de muerte" es un término médicolegal que toma un tiempo latente para establecerse médicamente, informar y recolectar. Solo se puede afirmar esto en retrospectiva cuando la probabilidad de perder una causa de muerte es pequeña, o de lo contrario se corrige la falta de datos, por ejemplo, al incluir informes tardíos del período de tiempo de informes anterior. Por lo tanto, una declaración estadísticamente adecuada suena algo así como: "En la región de recopilación de datos geográficos durante el período de tiempo, se estimó que las probabilidades de muerte atribuibles a accidentes automovilísticos eran una de cada 80 muertes".
Carl
7

Estoy de acuerdo en que su interpretación de la segunda declaración es consistente con la primera declaración. También estaría de acuerdo en que es una interpretación perfectamente razonable de la segunda declaración. Dicho esto, la segunda declaración es mucho más ambigua.

La segunda declaración también se puede interpretar como:

  • Dada una muestra de individuos en un accidente automovilístico reciente, 1/80 murieron.
  • Dada una muestra de población en general, 1/80 morirá debido a factores relacionados con un accidente automovilístico, algunos de ellos son los propios accidentes, pero otros son suicidios, lesiones, negligencia médica, justicia vigilante, etc.
  • La extrapolación de las tendencias actuales de seguridad indica que 1/80 personas vivas hoy morirán a causa de un accidente automovilístico.

Las interpretaciones segunda y tercera anteriores pueden ser lo suficientemente cercanas para el público lego, pero la primera es bastante diferente.

Alex H.
fuente
2
La primera interpretación '1/80 de todas las víctimas en un accidente automovilístico mueren a causa del accidente' es cómo interpreté la segunda declaración al principio. Aunque no creo que sea una interpretación correcta y se parezca más a una lectura rápida.
Sextus Empiricus
5

La diferencia básica es que las dos declaraciones se refieren a diferentes poblaciones de humanos y diferentes marcos de tiempo.

"Una de cada 80 muertes es causada por un accidente automovilístico" presumiblemente se refiere a la proporción de muertes en un período de tiempo bastante limitado (digamos un año). Dado que la proporción de la población total que usa automóviles y el registro de seguridad de los automóviles han cambiado significativamente con el tiempo, la declaración no tiene ningún sentido a menos que indique a qué intervalo de tiempo se refiere. (Como un ejemplo ridículo, claramente habría sido completamente incorrecto para el año 1919, considerando el nivel de propiedad y uso de automóviles en la población total en ese momento). Tenga en cuenta que la "proporción de la población total que usa autos" en lo anterior es en realidad un error: debe ser "la proporción de personas que morirán en el futuro cercano usando autos"

"Una de cada 80 personas muere como resultado de un accidente automovilístico" presumiblemente se refiere a todos los humanos que actualmente están vivos en alguna región, y su posible causa de muerte en algún momento futuro desconocido. Dado que la prevalencia y la seguridad del viaje en automóvil casi seguramente cambiarán dentro de sus vidas (digamos en los próximos 100 años, para los recién nacidos de hoy), esta es una declaración muy diferente de la primera.

alephzero
fuente
3

A1) Suponiendo que todos mueren, y asumiendo el contexto de un período de tiempo suficientemente pequeño alrededor del que se tomaron las mediciones, sí, su interpretación de S2 coincide con S1.

A2) Sí, su interpretación de S2 es imprudente. S2 puede interpretarse como "1 de cada 80 personas involucradas en accidentes automovilísticos mueren", lo que obviamente no es equivalente a S1. Por lo tanto, usar S2 podría causar confusión.

Sin embargo, su interpretación de 1 en 80 es razonable, y la otra interpretación (1 en cualquiera de 80) es muy inusual. "1 en N de U es P" es una abreviatura muy común para "dado un predicado, P y N muestras aleatorias, x, del universo U, el número esperado de muestras de modo que P (x) sea verdadero es aproximadamente igual a 1" .

A3) Fuera si todas las personas, 1 de cada 80 muere como resultado de un accidente automovilístico.

Vaelus
fuente
No explicas tu respuesta a A1. Sin embargo, ha habido algunas respuestas que abordan otros problemas (decir no a A1). ¿Podría explicar por qué eso no está bien?
Sextus Empiricus
@MartijnWeterings La única respuesta que dice no a A1 parece estar en desacuerdo sobre la base de que durante un período de tiempo finito, no todos mueren necesariamente. ¿Crees que mi edición aborda esto?
Vaelus
Creo que la oración que no indica que los otros 79 murieron por otras causas es, por lo tanto, ambigua. Por lo tanto, es mejor indicar el otro.
Michael Chernick
Vaelus, hay otra razón para decir 'no' a A1. Esa razón es que la fracción de muertes que se deben a accidentes automovilísticos puede no necesitar ser constante en el tiempo, por lo tanto, es ambigua, y S1 y S2 tienen una perspectiva diferente con respecto a esta expresión (no constante).
Sextus Empiricus
-1

Sí, está mal, y ninguna frase parece suficiente para transmitir constantemente el significado deseado.

Hablando como laico, si su objetivo es laico, definitivamente recomendaría publicar en https://english.stackexchange.com/ , en lugar de aquí: su pregunta me llevó algunas lecturas para desenredar lo que S1 y S2 significan intuitivamente para mí vs. lo que querías decir.

Para el registro, mis interpretaciones de cada declaración:

  • (S1) - por 80 muertes, 1 muerte por accidente automovilístico

  • (S2) - por 80 personas en un accidente automovilístico, 1 muerte

Para transmitir su significado, probablemente usaría un S2 modificado: "Una de cada 80 personas morirá en un accidente automovilístico".

Esto todavía contiene cierta ambigüedad, pero mantiene una brevedad similar.

ap55
fuente
Este es un comentario y no una respuesta.
Michael Chernick
1
@ Michael Lo siento, ¿cómo es eso? No estoy pidiendo aclaraciones, ni señalando errores tipográficos ni nada. Avíseme si la edición ayuda.
ap55