Preguntas etiquetadas con outliers

Un valor atípico es una observación que parece ser inusual o no está bien descrita en relación con una caracterización simple de un conjunto de datos. Una posibilidad desconcertante es que estos datos provienen de una población diferente a la que se pretende estudiar.

93
Pruebas de comprobación de datos esenciales.

En mi trabajo, a menudo trabajo con conjuntos de datos de otras personas, los no expertos me traen datos clínicos y los ayudo a resumirlos y realizar pruebas estadísticas. El problema que tengo es que los conjuntos de datos que traigo casi siempre están plagados de errores tipográficos,...

89
Interpretando plot.lm ()

Tenía una pregunta sobre la interpretación de las gráficas generadas por plot (lm) en R. Me preguntaba si ustedes podrían decirme cómo interpretar las gráficas de ubicación de escala y apalancamiento residual. Cualquier comentario será bienvenido. Asumir conocimientos básicos de estadística,...

78
Un ejemplo: regresión LASSO usando glmnet para el resultado binario

Estoy empezando a incursionar con el uso de glmnetla LASSO regresión donde mi resultado de interés es dicotómica. He creado un pequeño marco de datos simulados a continuación: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84,...

71
Generar una variable aleatoria con una correlación definida con una variable o variables existentes

Para un estudio de simulación tengo para generar variables aleatorias que muestran un (población) de correlación prefined a una variable existente .YYY Miré en los Rpaquetes copulay CDVineque pueden producir distribuciones aleatorias multivariadas con una estructura de dependencia dada. Sin...

44
¿Definición rigurosa de un valor atípico?

La gente a menudo habla de tratar con valores atípicos en las estadísticas. Lo que me molesta de esto es que, por lo que puedo decir, la definición de un valor atípico es completamente subjetiva. Por ejemplo, si la distribución verdadera de alguna variable aleatoria es muy pesada o bimodal,...

35
Detección de valores atípicos en series temporales (LS / AO / TC) utilizando el paquete tsoutliers en R. ¿Cómo representar valores atípicos en formato de ecuación?

Comentarios: En primer lugar me gustaría decir un gran agradecimiento a la autora de la nueva tsoutliers paquete que implementa Chen y Liu detección de series temporales de valores atípicos que fue publicado en la Revista de la Asociación Americana de Estadística en 1993 en el software de código...

33
¿Está bien eliminar los valores atípicos de los datos?

Busqué una manera de eliminar los valores atípicos de un conjunto de datos y encontré esta pregunta . Sin embargo, en algunos de los comentarios y respuestas a esta pregunta, las personas mencionaron que es una mala práctica eliminar los valores atípicos de los datos. En mi conjunto de datos...

31
Reemplazar valores atípicos con media

Esta pregunta fue hecha por mi amigo que no conoce Internet. No tengo antecedentes en estadísticas y he estado buscando en internet esta pregunta. La pregunta es: ¿es posible reemplazar los valores atípicos con valor medio? si es posible, ¿hay alguna referencia de libro / revistas para respaldar...

27
Detección de valores atípicos utilizando desviaciones estándar

Siguiendo mi pregunta aquí , me pregunto si hay opiniones fuertes a favor o en contra del uso de la desviación estándar para detectar valores atípicos (por ejemplo, cualquier punto de datos que tenga más de 2 desviaciones estándar es un valor atípico). Sé que esto depende del contexto del estudio,...