Recientemente recibí un comentario de un revisor de un envío de una revista que me pidió que
Informe cómo traté con los valores atípicos y los fringeliers .
No había oído hablar del término "fringeliers" y cuando busqué en Google, había algunos artículos, pero ninguna definición concisa. Así que pensé que sería bueno tener una pregunta como esta que podría aclarar qué son los "fringeliers" y proporcionar una definición tanto para mí como para las futuras personas que hacen la misma pregunta.
terminology
outliers
Jeromy Anglim
fuente
fuente
Respuestas:
Fringeliers parece definirse como un tipo de valor atípico menos extremo. Es decir, datos sobre los márgenes de la distribución.
Por ejemplo, si definiera un límite para valores atípicos, los fringeliers podrían operacionalizarse para ser aquellos valores que están cerca de cualquier lado del límite (por ejemplo, para un límite de 3 SD, entre 2.7 y 3.3 SD de la media).
Osborne y Overbay (2008) escriben lo siguiente:
Y pase a introducir el término "fringelier" de Wainer (1976)
Algunos ejemplos:
En algunos contextos, los valores atípicos sugieren que los datos no son válidos. Por ejemplo, si la altura de un hombre se registra como 8 pies de alto (digamos 6.5 SD por encima de la media), esta es probablemente una medida no válida. Por el contrario, si la altura de alguien se registra como 6 pies y 10 pulgadas de alto (3 SD por encima de la media, un flequillo), esta podría ser una medición válida, pero igualmente, podría sugerir un problema con la medición, ya que esto es bastante raro. El punto es que determinar si un valor es inválido se vuelve más difícil, menos extremo se vuelve el valor.
En otros contextos, los valores atípicos son una preocupación porque tienen una influencia excesiva en las estimaciones de parámetros, particularmente cuando se usan métodos estadísticos estándar que usan mínimos cuadrados, etc. Por lo tanto, los fringeliers pueden tener un mayor impacto que la mayoría de los casos, pero las decisiones sobre si conservar los datos o no para fines de modelado pueden ser menos claros.
Referencias
fuente
Creo que necesitaría considerar la frecuencia de los fringeliers con los puntos de datos que residen debajo del límite. Si la proporción de fringeliers a datos "válidos" es alta (en función de algunos factores), quizás el límite no se define de manera realista. Imagina que estás en una tienda de campaña, y los únicos osos en el área están a 3 millas de distancia; pero hay 500 de ellos! :)
fuente