¿Existen diferencias en los enfoques bayesianos y frecuentistas de la EDA?

14

En pocas palabras: ¿hay alguna diferencia en los enfoques bayesianos y frecuentes para el análisis exploratorio de datos?

No conozco sesgos inherentes a los métodos de EDA, ya que un histograma es un histograma, un diagrama de dispersión es un diagrama de dispersión, etc., ni he encontrado ejemplos de diferencias en cómo se enseña o presenta EDA (ignorando un artículo particularmente teórico de A. Gelman) . Finalmente, miré a CRAN, el árbitro de todas las cosas aplicadas: no he encontrado paquetes adaptados a un enfoque bayesiano. Sin embargo, pensé que CV podría tener algunas personas que podrían arrojar una luz sobre esto.

¿Por qué debería haber diferencias?

Para principiantes:

  1. Al identificar distribuciones previas apropiadas, ¿no debería uno investigar esto visualmente?
  2. Al resumir datos y sugerir si se usa un modelo bayesiano o frecuentista, ¿no debería la EDA sugerir qué dirección tomar?
  3. Los dos enfoques tienen diferencias muy claras sobre cómo manejar los modelos de mezcla. Identificar que una muestra probablemente proviene de una mezcla de poblaciones es un desafío y está directamente relacionado con la metodología utilizada para estimar los parámetros de la mezcla.
  4. Ambos enfoques incorporan modelos estocásticos y la selección del modelo se basa en la comprensión de los datos. Los datos más complejos o los modelos más complejos requieren más tiempo en EDA. Con tales distinciones entre modelos estocásticos o procesos generadores, existen diferencias en las actividades de EDA, entonces, ¿no debería haber distinciones derivadas de diferentes enfoques estocásticos?

Nota 1: No me interesan las filosofías de ninguno de los "campamentos": solo quiero abordar las lagunas en mi kit de herramientas y métodos EDA.

Iterador
fuente

Respuestas:

17

En mi opinión, Bayes vs. Frecuentista se trata de inferencia formal, y el análisis exploratorio de datos tampoco.

Ciertamente, cuando se trata de modelo de evaluación / bondad de ajuste y análisis de sensibilidad, en el que clasificaría sus puntos (1), (3) y (4), habrá diferencias en cómo se procedería, pero Esto se debe a la naturaleza de las diferencias entre el análisis y los métodos computacionales, más que a la filosofía.

Con respecto a su (2), generalmente no veo que los resultados de la EDA lo apunten hacia el enfoque bayesiano o frquentista, sino que creo que era el objetivo del estudio lo que más importaba.

Para mí personalmente, la EDA (más una introspección profunda) me apuntaría hacia un modelo, y si pudiera encontrar un enfoque natural frecuentador que respondiera razonablemente a la pregunta científica, iría con eso, pero si por la naturaleza de la situación , ningún método frecuente funcionaría bien, y si hubiera un previo razonable, usaría Bayes.

Karl
fuente
(+1) Muy bien dicho, especialmente, "EDA (más una introspección profunda) me señalaría hacia un modelo"
suncoolsu
+1 también. EDA realmente no se trata de elegir una perspectiva, se trata de comprender sus datos para tomar decisiones más informadas.
Fomite
+1 Por una buena respuesta. Desafortunadamente, creo que la pregunta original fue mal entendida. No estaba preguntando sobre el uso de EDA para decidir entre modelos bayesianos o frecuentistas. Tendré que revisar cómo lo redacté si parece que varias personas tienen el mismo malentendido.
Iterator
@Iterator Entiendo que su pregunta principal es: ¿hay diferencias entre los enfoques bayesianos y frecuentistas de EDA? Mi respuesta a eso es: no; EDA no es frecuentista ni bayesiano.
Karl
3
Creo que mi definición de "análisis exploratorio de datos" es más limitada que la suya. En mi opinión, todo buen análisis de datos implica exploración. Lo que distingue el "análisis exploratorio de datos" es la falta de un modelo o cualquier esfuerzo hacia la inferencia formal.
Karl
0

Creo que EDA lo ayuda a construir un modelo, hacer algunas suposiciones y (si es necesario) actualizar el modelo y sus suposiciones. Elijo un enfoque pragmático para usar en la adaptación y evaluación del modelo.

hbaghishani
fuente