He leído que usar escalas de registro cuando los gráficos / gráficos son apropiados en ciertas circunstancias, como el eje y en un gráfico de series de tiempo. Sin embargo, no he podido encontrar una explicación definitiva de por qué ese es el caso, o cuándo sería apropiado. Tenga en cuenta que no soy un estadístico, por lo que podría estar perdiendo el punto por completo y, si ese es el caso, agradecería la dirección de los recursos correctivos.
57
Respuestas:
Esta es una pregunta muy interesante y en la que muy poca gente piensa. Hay varias formas diferentes en que una escala logarítmica puede ser apropiada. El primero y más conocido es el mencionado por Macro en su comentario: las escalas logarítmicas permiten que se muestre un rango grande sin que los valores pequeños se compriman en la parte inferior del gráfico.
Una razón diferente para preferir una escala de registro es en circunstancias en las que los datos se expresan más geométricamente de forma natural. Un ejemplo es cuando los datos representan la concentración de un mediador biológico. Las concentraciones no pueden ser negativas y la variabilidad casi invariablemente aumenta con la media (es decir, hay una variación heterocedástica). Usando una escala logarítmica o, de manera equivalente, usando la concentración logarítmica como primaria, la medida 'arregla' la variabilidad desigual y proporciona una escala que no tiene límites en ambos extremos. Las concentraciones probablemente se distribuyen normalmente en forma logarítmica, por lo que una escala logarítmica nos da un resultado muy conveniente que podría decirse que es 'natural'. En farmacología utilizamos una escala logarítmica para las concentraciones de fármacos con mucha frecuencia,
Otra buena razón para una escala logarítmica, probablemente la que le interesa para los datos de series temporales, proviene de la capacidad de una escala logarítmica para hacer que los cambios fraccionales sean equivalentes. Imagine una muestra del desempeño a largo plazo de sus inversiones de jubilación. (Debería) estar creciendo aproximadamente exponencialmente porque el interés de mañana depende de la inversión de hoy (más o menos). Por lo tanto, incluso si el rendimiento en términos porcentuales ha sido bastante constante, un gráfico de los fondos parecerá haber crecido más rápidamente en el extremo derecho. Con una escala logarítmica, un cambio porcentual constante se ve como una distancia vertical constante, por lo que una tasa de crecimiento constante se ve como una línea recta. Eso es a menudo una ventaja sustancial.
Otra razón un poco más esotérica para elegir una escala logarítmica se produce en circunstancias en las que los valores se pueden expresar razonablemente como x o 1 / x. Un ejemplo de mi propia investigación es la resistencia vascular que también se puede expresar de manera sensata como la conductancia vascular recíproca. (También es razonable en algunas circunstancias pensar en el diámetro de los vasos sanguíneos que se escalan como un poder de resistencia o conductancia). Ninguna de esas medidas tiene más realidad que la otra y ambas se pueden encontrar en trabajos de investigación. Si se escalan logarítmicamente, entonces son simplemente negativos entre sí y la elección de uno u otro no hace una diferencia sustancial. (El diámetro vascular diferirá de la resistencia y la conductancia por un multiplicador constante cuando todos estén escalados).
fuente
Algunos ejemplos de la vida real que tuve que entregar como una adición a la muy buena respuesta de @Michael Lew.
Primero, las dos gráficas de series de tiempo a continuación muestran las llegadas mensuales de visitantes a Nueva Zelanda, disponibles en Statistics New Zealand . Ambas gráficas tienen su propósito, pero encuentro que la que tiene el eje vertical en una escala logarítmica es espectacularmente útil para muchos más propósitos que la primera. Por ejemplo, puede ver que la estacionalidad en las llegadas se mantiene aproximadamente proporcional a la escala de las llegadas; y puede ver los cambios significativos en la tasa de crecimiento (por ejemplo, durante la segunda guerra mundial) que son invisibles en la escala original.
En segundo lugar, las siguientes gráficas muestran el gasto total relacionado con el viaje de los turistas a Nueva Zelanda, en comparación con el gasto mientras están en Nueva Zelanda. La fuente es la Encuesta internacional de visitantes del Ministerio de Desarrollo Económico. La diferencia es el gasto previo al viaje, por ejemplo, hoteles o paquetes pagados por adelantado. El primer gráfico, en la escala original, se puede utilizar para algunos fines distintos de una impresión muy cruda (pero importante) de los datos que se agrupan en la esquina inferior izquierda. La segunda trama sacrifica algo de interpretación inmediata, particularmente para los no estadísticos (debido a esto, normalmente ahora usaría una escala logarítmica en los ejes, en lugar de transformar los datos y tener la escala que muestra el valor logarítmico), pero da mucho Más diferenciación visual.
Por ejemplo, puede detectar claramente los pocos valores atípicos (que resultaron ser errores de edición de datos) donde el gasto total fue menor que el gasto en Nueva Zelanda. Quizás lo más importante es que podría usar este gráfico con diferentes colores o facetas para mostrar cómo los diferentes países del mercado o el propósito de la visita (por ejemplo, vacaciones vs. visitar amigos y familiares) ocupan diferentes partes del "espacio" de gastos, algo que simplemente sería invisible en los ejes originales.
Convertir esta trama en algo útil implicaría de alguna manera tratar con los datos de alta densidad (por ejemplo, agregando algo de transparencia a los puntos o reemplazando puntos con contenedores hexagonales coloreados de acuerdo con la densidad), pero cualquier solución visual útil seguramente involucrará ejes logarítmicos.
editar / adición
Otra trama para ilustrar lo que quise decir con los contenedores hexagonales, usando el color para representar la densidad cuando hay un gran conjunto de datos (en este caso, alrededor de 12000 encuestados sobre una encuesta sobre experiencias de la Copa Mundial de Rugby en Nueva Zelanda). Tenga en cuenta nuevamente que este es otro ejemplo en el que he usado una escala logarítmica para gastos.
fuente
Otra cosa ingeniosa sobre las escalas logarítmicas es que hacen que las relaciones parezcan simétricas. Por ejemplo, así:
fuente