A veces, en los informes, incluyo un descargo de responsabilidad sobre los valores p y otras estadísticas inferenciales que he proporcionado. Digo que, dado que la muestra no fue aleatoria, esas estadísticas no se aplicarían estrictamente. Mi redacción específica generalmente se da en una nota al pie:
"Si bien, estrictamente hablando, las estadísticas inferenciales solo son aplicables en el contexto del muestreo aleatorio, seguimos la convención para informar los niveles de significancia y / o los intervalos de confianza como criterios convenientes incluso para muestras no aleatorias. Vea la inferencia estadística de Michael Oakes : Un comentario para lo social y ciencias del comportamiento (NY: Wiley, 1986).
En un par de ocasiones, una vez para un artículo revisado por pares, una o dos veces en un entorno no académico, el editor o revisor se opuso a este descargo de responsabilidad, calificándolo de confuso, y consideró que los hallazgos inferenciales simplemente deberían quedar tal como están escritos. (y recibir el manto de autoridad). ¿Alguien más ha encontrado este problema y ha encontrado una buena solución? Por un lado, la comprensión de las personas de los valores p es generalmente triste, incluso en el contexto de un muestreo aleatorio, por lo que quizás no importa mucho lo que digamos. Por otro lado, contribuir más a los malentendidos parece formar parte del problema. Debo agregar que con frecuencia trato con estudios de encuestas, donde la asignación aleatoria no se aplica y donde las simulaciones de Monte Carlo a menudo no abordan el tema de la representatividad.
Respuestas:
De hecho, hay un argumento para no incluir el descargo de responsabilidad. Francamente, un breve tratado sobre la naturaleza de los valores p en un artículo de revista es un poco desagradable, y por un momento tendría que hacer una pausa e intentar averiguar si había hecho algo en particular ... .esotérico ... para justificar dedicar ese espacio a un punto de definición.
Básicamente, como revisor, lo llamaría innecesario porque el lector ya debería saber qué es un valor p y qué hace. Incluso podría objetarlo porque tomar esa nota en realidad no evita ninguno de los muchos delitos de análisis e interpretación que acompañan a los valores p, simplemente se pone una capa de "confía en mí, sé lo que estoy haciendo". También es un poco extraño: "Voy a tomar una posición audaz contra los valores p, pero no tan audaz como para no informarlos".
Cuando considero "puntos de vista arraigados sobre los valores p", estoy mucho menos preocupado por algo como lo que publicó anteriormente, y mucho más preocupado por la insistencia de los revisores en la significación estadística para ser publicado o el foco del documento (poner una estrella por un hallazgo y de repente es un gran problema) o la combinación de significación estadística con el significado de un hallazgo
fuente
El uso de estadísticas inferenciales puede justificarse no solo según un modelo de población, sino también según un modelo de aleatorización. Este último no hace suposiciones sobre la forma en que se ha obtenido la muestra. De hecho, Fisher fue quien sugirió que el modelo de aleatorización debería ser la base para la inferencia estadística (a diferencia de Neyman y Pearson). Ver, por ejemplo:
Ernst, MD (2004). Métodos de permutación: una base para la inferencia exacta. Ciencia estadística, 19, 676-685. [enlace (acceso abierto)]
Ludbrook, J. y Dudley, H. (1998). Por qué las pruebas de permutación son superiores a las pruebas t y F en la investigación biomédica. Estadístico estadounidense, 52, 127-132. [enlace (si tiene acceso a JSTOR)]
Sin embargo, de alguna manera dudo que los editores o revisores en cuestión estuvieran usando esto como la razón para llamar a su descargo de responsabilidad "confuso".
fuente
Otra opción potencialmente complementaria sería ampliar su nota al pie. Tanto sus descripciones del problema como los revisores lo han experimentado, como la respuesta actualmente aceptada en esta página, sugieren que no se transmite suficiente información para explicar su motivación para incluir la nota al pie, ni suficiente para motivar al lector a seguir su cita a la referencia. que usas para explicarlo tan brevemente. Una sola oración adicional, incluso una breve cita de su referencia, podría explicar en gran medida el valor de su nota al pie y motivar a los lectores a leer más profundamente. Evidentemente, su nota de pie de página como antes motiva una reacción simple, negativa y despectiva hacia su intento discreto de interrumpir su complacencia sobre sus suposiciones inadecuadas. Los lectores pueden ser un poco menos perezosos intelectualmente si les da uno o dos de los puntos principales sobre los problemas que probablemente pasan por alto de forma rutinaria. Además, para muchos problemas particulares conpags
Referencias
- Goodman, SN (1992). Un comentario sobre replicación, valores P y evidencia. Estadísticas en medicina, 11 (7), 875–879.
- Goodman, SN (2001). De los valores P y Bayes: una propuesta modesta. Epidemiología, 12 (3), 295–297. Recuperado de http://swfsc.noaa.gov/uploadedFiles/Divisions/PRD/Programs/ETP_Cetacean_Assessment/Of_P_Values_and_Bayes__A_Modest_Proposal.6.pdf .
- Goodman, S. (2008). Una docena sucia: doce conceptos erróneos de valor P Seminarios en hematología, 45 (3), 135–140. Recuperado de http://xa.yimg.com/kq/groups/18751725/636586767/name/twelve+P+value+misconceptions.pdf .
- Gorroochurn, P., Hodge, SE, Heiman, GA, Durner, M. y Greenberg, DA (2007). No replicación de los estudios de asociación: ¿"pseudo-fallas" para replicar? Genética en medicina, 9 (6), 325–331. Recuperado de http://www.nature.com/gim/journal/v9/n6/full/gim200755a.html .
- Hurlbert, SH y Lombardi, CM (2009). Colapso final del marco teórico de decisión de Neyman-Pearson y surgimiento del neofisheriano. Annales Zoologici Fennici, 46 (5), 311–349. Recuperado de http://xa.yimg.com/kq/groups/1542294/508917937/name/HurlbertLombardi2009AZF.pdf .
- Lew, MJ (2013). Para P o no para P: Sobre la naturaleza evidencial de los valores P y su lugar en la inferencia científica. arXiv: 1311.0081 [stat.ME]. Recuperado dehttp://arxiv.org/abs/1311.0081 .
- Nuzzo, R. (12 de febrero de 2014). Método científico: errores estadísticos. Nature News, 506 . - Wagenmakers, EJ (2007). Una solución práctica a los problemas generalizados de(7487). Recuperado de http://www.nature.com/news/scientific-method-statistical-errors-1.14700 .
- Rosenthal, R., Rosnow, RL y Rubin, DB (2000). Contrastes y tamaños de efectos en la investigación conductual: un enfoque correlacional. Prensa de la Universidad de Cambridge.
- Senn, S. (2001). ¿Dos hurras por los valores P? Revista de Epidemiología y Bioestadística, 6 (2), 193–204. Recuperado de http://www.phil.vt.edu/dmayo/conference_2010/Senn%20Two%20Cheers%20Paper.pdf
valores de p . Psychonomic Bulletin & Review, 14 (5), 779–804. Recuperado de http://www.brainlife.org/reprint/2007/Wagenmakers_EJ071000.pdf .
fuente