Estoy buscando consejos y comentarios que aborden el análisis de ratios y tasas. En el campo en el que trabajo, el análisis de las relaciones en particular está muy extendido, pero he leído algunos documentos que sugieren que esto puede ser problemático, estoy pensando en:
Kronmal, Richard A. 1993. Correlación espuria y la falacia de la relación estándar revisitada. Revista de la Real Sociedad Estadística Serie A 156 (3): 379-392
y documentos relacionados. Por lo que he leído hasta ahora, parece que las razones pueden generar correlaciones espurias, forzar líneas de regresión a través del origen (que no siempre es apropiado) y modelarlas puede violar el principio de marginalidad si no se hace correctamente ( Uso de relaciones en regresión , por Richard Goldstein ) Sin embargo, debe haber ocasiones en que el uso de proporciones esté justificado y quisiera algunas opiniones de los estadísticos sobre este tema.
Respuestas:
No llamaría falsas correlaciones observadas, sino más bien falsas inferencias causales extraídas de esas correlaciones. Los problemas con las proporciones son del mismo tipo que otros tipos de confusión.
Si define variables aleatorias & , donde , y son independientes, entonces y están correlacionados. Esto podría inducirlo a error a pensar que hay una relación causal de a o viceversa, o de algo diferente de para ambos. No sirve de nada, sin embargo, simplemente decidir evitar el uso de proporciones. Las observaciones no son esencialmente proporciones, y si , y son independientes, introducirá correlaciones "espurias" utilizando las proporcionesU=XQ V=YQ X Y Q U V X Y Q U V Q X=U1/Q e . Incluir en su análisis, y es importante tener en cuenta que 'escalar' por no es lo mismo †, lo protege lo que use; pero no de otros factores de confusiónY=V1/Q Q Q R,S,T,…
Aldrich (1995), "" Correlaciones genuinas y espurias en Pearson y Yule ", Statistical Science , 10 , 4 proporciona una perspectiva histórica interesante.
† Consulte Incluir la interacción pero no los efectos principales en un modelo .
fuente