¿Cuál es la interpretación del rango intercuartil?

9

Tengo mediciones diarias de dióxido de nitrógeno durante un año (365 días) y el intercuartil (IQR) es de 24 microgramos por metro cúbico. ¿Qué significa "24" en este contexto, aparte de la definición de IQR, que es la diferencia entre el percentil 25 y 75 ? ¿Cómo explicarías esta cifra a un periodista, por ejemplo?

Gracias

usuario2742
fuente
¿Cuál es la media o la mediana?
mpiktas

Respuestas:

18

Por definición, esto define el rango que la bruja tiene 75-25 = 50 por ciento de todos los valores medidos.

: (mediana-24/2, mediana + 24/2). La mediana debe escribirse en algún lugar cerca de este IQR.
Lo anterior era falso, por supuesto, parece que todavía estaba durmiendo al escribir esto; perdon por la confusion. Es cierto que IQR es el ancho de un rango que contiene el 50% de los datos, pero no está centrado en la mediana; es necesario saber Q1 y Q3 para localizar este rango.

En general, IQR puede verse como un valor no paramétrico (= cuando no suponemos que la distribución es gaussiana) equivalente a la desviación estándar; ambas miden la dispersión de los datos. (Equivalente no igual, para SD, (mean- , mean + ) contiene el 68,2% de los datos perfectamente distribuidos normalmente).σσ

EDITAR: como por ejemplo, así es como se ve en los datos normales; las líneas rojas muestran , el rango mostrado por el cuadro en el diagrama de caja muestra IQR, el histograma muestra los datos en sí mismos: puede ver que ambos muestran una distribución bastante buena; rango contiene el 68,3% de los datos (como se esperaba). Ahora para datos no normales, la extensión SD se amplía debido a la cola larga y asimétrica y contiene el 90.5% de los datos. (IQR posee el 50% en ambos casos por definición)±1σtexto alternativo
±1σ
texto alternativo
±1σ

Utsav T
fuente
13

Esta es una pregunta simple que pide una respuesta simple. Aquí hay una lista de declaraciones, comenzando con las más básicas y continuando con calificaciones más precisas.

El IQR es la propagación de la mitad media de los datos.

Sin hacer suposiciones sobre cómo se distribuyen los datos , el IQR cuantifica la cantidad en la que los valores individuales suelen variar.

El IQR está relacionado con la conocida "desviación estándar" (SD): cuando los datos siguen una "curva de campana", el IQR es aproximadamente un 35% mayor que el SD. (Equivalentemente, el SD es aproximadamente tres cuartos del IQR).

Como regla general, los valores de datos que se desvían del valor medio en más del doble del IQR merecen atención individual. Se llaman "valores atípicos". Los valores de datos que se desvían del valor medio en más de 3.5 veces el IQR generalmente se analizan detenidamente. A veces se les llama "valores atípicos".

whuber
fuente
6

El rango intercuartil es un intervalo , no un escalar. Siempre debe informar ambos números, no solo la diferencia entre ellos. Luego puede explicarlo diciendo que la mitad de las lecturas de la muestra estaban entre estos dos valores, una cuarta parte era más pequeña que el cuartil inferior y una cuarta parte más alta que el cuartil superior.

una parada
fuente
44
@onestop Esto me lleva a pensar si IQR debería ser un intervalo o un escalar. De Wikipedia, se define como un escalar y es consistente con lo que he aprendido.
user2742
2
Siempre he sabido que el IQR es la diferencia entre el tercer y el primer cuartil, por lo tanto, un escalar.
nico
2
Aunque IQR podría definirse como un escalar, si se informa como un intervalo, lleva mucha más información. Por ejemplo, [-1,1] y [499,501] tendrán el mismo rango, pero las implicaciones son diferentes.
mpiktas
1
(En mi humilde opinión) IQR es un escalar: es la longitud de un intervalo. Obviamente, dado que siempre es posible pasar de la segunda (situada en un subconjunto de R ^ 2) a la primera (situada en R +) pero no a la inversa, la última es más informativa que la primera.
vidrioso
1
Esperaba que esto fuera controvertido y me doy cuenta de que no es la definición habitual , pero creo que es más útil. En mi experiencia con la literatura médica, es mucho más común informar ambos cuartiles como IQR en lugar de la diferencia entre ellos, y me alegro de que ese sea el caso.
parada el
1

Hablando en términos generales, le diría a un periodista que podría declarar que el nivel diario de dióxido de nitrógeno es seguro, después de descartar los valores más altos y los valores más bajos, que en cada uno de la mitad de los días de ese año el valor observado es no más allá de una distancia de IQR / 2 desde el nivel declarado.

Por ejemplo, si su primer cuartil y tercer cuartil son 100 y 124, podría decir que el nivel diario es 112 (promedio de 100 y 124) y asegurar a su interlocutor que en la mitad de los días el error que comete no es mayor que 12 .

vidrioso
fuente
¿Podría explicar la distinción que hace entre el nivel "observado" y el "declarado"? (También sospecho que a un buen periodista le molestaría la implicación de que está "descartando" valores y haría un seguimiento con algunas preguntas difíciles :-).)
whuber
@whuber: agrego un ejemplo a mi respuesta. Sobre las preguntas difíciles, supongo que surgen incluso si su respuesta se refiere a la distribución normal (como lo hacen otras respuestas a esta pregunta), o algún otro concepto. ¿Podría ser más simple explicar una media recortada del 50%? Si es así, entonces diga que el IQR es la longitud del rango de sus observaciones
vidrioso