Para un problema de regresión logística bayesiana, he creado una distribución predictiva posterior. Tomo muestras de la distribución predictiva y recibo miles de muestras de (0,1) por cada observación que tengo. Visualizar la bondad de ajuste es menos que interesante, por ejemplo:
Este gráfico muestra las 10 000 muestras + el punto de referencia observado (en el lado izquierdo se puede distinguir una línea roja: sí, esa es la observación). El problema es que esta trama es apenas informativa, y tendré 23 de ellos, uno para cada punto de datos.
¿Hay una mejor manera de visualizar los 23 puntos de datos más las muestras posteriores?
Otro intento:
Otro intento basado en el documento aquí
bayesian
data-visualization
classification
goodness-of-fit
binary-data
Cam.Davidson.Pilon
fuente
fuente
Respuestas:
Tengo la sensación de que no estás entregando todos los bienes a tu situación, pero dado lo que tenemos frente a nosotros, consideremos la utilidad de un simple diagrama de puntos para mostrar la información.
Lo único real que no está aquí (que quizás no sean comportamientos predeterminados) son:
La clasificación es la verdadera patada para diagramas de puntos como estos. Ordenar por valores de proporción aquí ayuda a descubrir fácilmente observaciones residuales elevadas. Tener un sistema en el que pueda ordenar fácilmente por valores contenidos en la trama o en las características externas de los casos es la mejor manera de obtener el beneficio de su inversión.
Este consejo se extiende también a las observaciones continuas. Puede colorear / dar forma a los puntos según si el residuo es negativo o positivo, y luego dimensionar el punto según el residuo absoluto (o al cuadrado). Esto es IMO no necesario aquí, aunque debido a la simplicidad de los valores observados.
fuente
La forma habitual de visualizar el ajuste de un modelo de regresión logística bayesiana con un predictor es trazar la distribución predictiva junto con las proporciones correspondientes. (Por favor, avíseme si entendí su pregunta)
Un ejemplo usando el popular conjunto de datos de Bliss.
Código abajo en R:
fuente
ni = 23
eno = 7
y cada uno de los 23 individuos tiene una diferentedose
. Sin embargo, podría hacer una gráfica similar para los datos del OP (los puntos se colocan en 0 o 1 en el eje Y, y usted traza la función). Vea algunos ejemplos de parcelas similares para la regresión logística en las referencias que doy en esta respuesta .Estoy respondiendo a una solicitud de técnicas gráficas alternativas que muestran qué tan bien los eventos de falla simulados coinciden con los eventos de falla observados. La pregunta surgió en "Programación probabilística y métodos bayesianos para hackers" que se encuentra aquí . Aquí está mi enfoque gráfico:
Código encontrado aquí .
fuente