Es bien sabido que los investigadores deberían pasar tiempo observando y explorando los datos e investigaciones existentes antes de formar una hipótesis y luego recolectar datos para probar esa hipótesis (refiriéndose a la prueba de significación de hipótesis nula). Muchos libros de estadísticas básicas advierten que las hipótesis deben formarse a priori y no pueden cambiarse después de la recopilación de datos; de lo contrario, la metodología se vuelve inválida.
Entiendo que una de las razones por las cuales cambiar una hipótesis para que se ajuste a los datos observados es problemático es debido a la mayor posibilidad de cometer un error de tipo I debido a datos espurios, pero mi pregunta es: ¿ es esa la única razón o hay otros problemas fundamentales para ir? en una expedición de pesca?
Como pregunta adicional, ¿hay formas de realizar expediciones de pesca sin exponerse a los posibles peligros? Por ejemplo, si tiene suficientes datos, ¿podría generar hipótesis a partir de la mitad de los datos y luego usar la otra mitad para probarlos?
actualizar
Aprecio el interés en mi pregunta, pero las respuestas y comentarios están principalmente dirigidos a lo que pensé que establecí como información de fondo. Estoy interesado en saber si hay otras razones por las cuales es malo más allá de la mayor posibilidad de resultados espurios y si hay formas, como dividir los datos primero, de cambiar una hipótesis post hoc pero evitar el aumento de los errores de Tipo I.
He actualizado el título para que espere refleje el impulso de mi pregunta.
Gracias, y perdón por la confusión!
fuente
Respuestas:
Ciertamente puedes ir a expediciones de pesca, siempre y cuando admitas que es una expedición de pesca y la trates como tal. Un nombre más agradable para eso es "análisis exploratorio de datos".
Una mejor analogía podría ser disparar a un objetivo:
Puedes disparar a un blanco y celebrar si le das al blanco.
Puedes disparar sin objetivo para probar las propiedades de tu arma.
Pero es una trampa disparar a una pared y luego pintar un objetivo alrededor del agujero de bala.
Una forma de evitar algunos de los problemas con esto es hacer la exploración en un conjunto de datos de entrenamiento y luego probarlo en un conjunto de datos de "prueba" separado.
fuente
But it's cheating to shoot at a wall and then paint a target around the bullet hole.
El problema con las expediciones de pesca es el siguiente: si prueba suficientes hipótesis, una de ellas se confirmará con un valor p bajo. Déjame darte un ejemplo concreto.
Imagina que estás haciendo un estudio epidemiológico. Ha encontrado 1000 pacientes que sufren de una condición rara. Quieres saber qué tienen en común. Entonces comienza a probar: desea ver si una característica particular está sobrerrepresentada en esta muestra. Inicialmente, realiza una prueba de género, raza, ciertos antecedentes familiares pertinentes (el padre murió de una enfermedad cardíaca antes de los 50 años, ...) pero eventualmente, como tiene problemas para encontrar algo que se "pegue", comienza a agregar todo tipo de otros factores que simplemente podría relacionarse con la enfermedad:
...
Ahora aquí está la cosa. Si selecciono suficientes hipótesis "aleatorias", comienza a ser probable que al menos una de ellas dé como resultado un valor p menor que 0.05, porque la esencia misma del valor p es "la probabilidad de estar equivocado al rechazar la hipótesis nula cuando existe no tiene efecto ". Dicho de otra manera: en promedio, por cada 20 hipótesis falsas que pruebe, una de ellas le dará una p <0.05 .
Esto se resume muy bien en la caricatura de XKCD http://xkcd.com/882/ :
La tragedia es que incluso si un autor individual no realiza 20 pruebas de hipótesis diferentes en una muestra para buscar significado, podría haber otros 19 autores haciendo lo mismo; y el que "encuentra" una correlación ahora tiene un artículo interesante para escribir, y uno que probablemente sea aceptado para su publicación ...
Esto lleva a una desafortunada tendencia a hallazgos irreproducibles. La mejor manera de protegerse contra esto como autor individual es poner el listón más alto. En lugar de probar el factor individual, pregúntese "si pruebo N hipótesis, cuál es la probabilidad de obtener al menos un falso positivo". Cuando realmente está probando "hipótesis de pesca", podría pensar en hacer una corrección de Bonferroni para protegerse contra esto, pero la gente con frecuencia no lo hace.
Hubo algunos documentos interesantes del Dr. Ioannides, perfilados en el Atlantic Monthly específicamente sobre este tema.
Vea también esta pregunta anterior con varias respuestas perspicaces.
actualice para responder mejor a todos los aspectos de su pregunta:
Si tiene miedo de estar "pescando", pero realmente no sabe qué hipótesis formular, definitivamente podría dividir sus datos en las secciones "exploración", "replicación" y "confirmación". En principio, esto debería limitar su exposición a los riesgos descritos anteriormente: si tiene un valor p de 0.05 en los datos de exploración y obtiene un valor similar en los datos de replicación y confirmación, su riesgo de equivocarse disminuye. Un buen ejemplo de "hacerlo bien" se mostró en el British Medical Journal (una publicación muy respetada con un factor de impacto de 17+)
Exploración y confirmación de factores asociados con el embarazo no complicado en mujeres nulíparas: estudio de cohorte prospectivo, Chappell et al.
Aquí está el párrafo relevante:
Volviendo un poco a la literatura, hay un buen artículo de Altman et al titulado "Pronóstico e investigación pronóstica: validando un modelo pronóstico" que profundiza mucho más y sugiere formas de asegurarse de que no caiga en este error. Los "puntos principales" del artículo:
Tenga en cuenta en particular la sugerencia de que se realice la validación (parafraseo) con datos de otras fuentes , es decir, no es suficiente dividir sus datos arbitrariamente en subconjuntos, pero debe hacer lo que pueda para demostrar que el "aprendizaje" en el conjunto de un conjunto de experimentos se pueden aplicar a datos de un conjunto diferente de experimentos. Esa es una barra más alta, pero reduce aún más el riesgo de que un sesgo sistemático en su configuración cree "resultados" que no se pueden verificar de forma independiente.
Es un tema muy importante. ¡Gracias por hacer la pregunta!
fuente
La pregunta pregunta si hay otros problemas además de la inflación de error tipo I que vienen con las expediciones de pesca.
fuente