En febrero de 2016, la Asociación Americana de Estadística emitió una declaración formal sobre significación estadística y valores p. Nuestro hilo al respecto discute estos temas ampliamente. Sin embargo, ninguna autoridad se ha presentado para ofrecer una alternativa efectiva universalmente reconocida, hasta ahora. La American Statistical Society (ASS) ha publicado su respuesta, valores p: ¿Qué sigue?
"El valor p no es bueno para mucho".
Creemos que la ASA no fue lo suficientemente lejos. Es hora de admitir que la era de los valores p ha terminado. Los estadísticos los han utilizado con éxito para desconcertar a los estudiantes universitarios, engañar a los científicos y engañar a los editores en todas partes, pero el mundo está empezando a ver a través de este truco. Necesitamos abandonar este intento de principios del siglo XX por parte de los estadísticos para controlar la toma de decisiones. Necesitamos volver a lo que realmente funciona.
La propuesta oficial de ASS es esta:
En lugar de valores p, el ASS aboga por el STOP (procedimiento SeaT-of-Pants). Este método antiguo y probado fue utilizado por los antiguos griegos, los hombres del renacimiento y todos los científicos hasta que apareció Ronald Fisher y arruinó las cosas. El STOP es simple, directo, basado en datos y autorizado. Para llevarlo a cabo, una figura de autoridad (un hombre mayor, de preferencia) revisa los datos y decide si están de acuerdo con su opinión. Cuando él decide que lo hacen, el resultado es "significativo". De lo contrario, no lo es y todos están obligados a olvidarse de todo.
Principios
La respuesta aborda cada uno de los seis principios de ASA.
El STOP puede indicar cuán incompatibles son los datos con un modelo estadístico especificado.
Nos gusta esta frase porque es una forma muy elegante de decir que STOP responderá cualquier pregunta sí o no. A diferencia de los valores p u otros procedimientos estadísticos, no deja dudas. Es la respuesta perfecta para aquellos que dicen "¡no necesitamos ninguna hipótesis nula apestosa! ¿Qué demonios es eso? Nadie podría darse cuenta de lo que se suponía que era ".
La PARADA no mide la probabilidad de que una hipótesis sea verdadera: en realidad decide si es cierta o no.
Todos están confundidos por las probabilidades. Al eliminar la probabilidad de la imagen, el STOP elimina la necesidad de años de estudios de pregrado y posgrado. Ahora, cualquiera (que sea lo suficientemente mayor como un hombre) puede realizar análisis estadísticos sin el dolor y la tortura de escuchar incluso una sola conferencia estadística o ejecutar un software arcano que arroje resultados ininteligibles.
Las conclusiones científicas y las decisiones comerciales o políticas pueden basarse en el sentido común y en figuras de autoridad real.
De todos modos, las autoridades siempre han tomado decisiones importantes, así que admitámoslo y eliminemos a los intermediarios. El uso de STOP liberará a los estadísticos para hacer lo que mejor les conviene: usar números para ofuscar la verdad y santificar las preferencias de aquellos en el poder.
La inferencia adecuada requiere informes completos y transparencia.
El STOP es el procedimiento estadístico más transparente y evidente que se haya inventado: mira los datos y decide. Elimina todas esas confusas pruebas z, pruebas t, pruebas de ji cuadrado y procedimientos de sopa de letras (ANOVA! GLM! MLE!) Utilizados por las personas para ocultar el hecho de que no tienen idea de lo que significan los datos.
El STOP mide la importancia del resultado.
Esto es evidente: si una persona con autoridad emplea el STOP, entonces el resultado debe ser importante.
Por sí mismo, el STOP proporciona una buena medida de evidencia con respecto a un modelo o hipótesis.
No quisiéramos desafiar a una autoridad, ¿verdad? Los investigadores y los tomadores de decisiones reconocerán que STOP proporciona toda la información que necesitan saber. Por estas razones, el análisis de datos puede terminar con STOP; no hay necesidad de enfoques alternativos, como valores p, aprendizaje automático o astrología.
Otros enfoques
Algunos estadísticos prefieren los llamados métodos "bayesianos", en los que un oscuro teorema publicado póstumamente por un clérigo del siglo XVIII se aplica sin pensar para resolver cada problema. Sus defensores más notables admiten libremente que estos métodos son "subjetivos". Si vamos a utilizar métodos subjetivos, entonces, obviamente, cuanto más autoritario y conocedor sea el tomador de decisiones, mejor será el resultado. De este modo, la PARADA emerge como el límite lógico de todos los métodos de Bayes. ¿Por qué hacer el esfuerzo de hacer esos terribles cálculos y dedicar tanto tiempo a la computadora, cuando puedes mostrar los datos al responsable y preguntarle cuál es su opinión? Fin de la historia.
Recientemente ha surgido otra comunidad para desafiar el sacerdocio de los estadísticos. Se llaman a sí mismos "aprendices de máquinas" y "científicos de datos", pero en realidad son solo hackers que buscan un estatus superior. Es la posición oficial de ASS que estos tipos deberían formar su propia organización profesional si quieren que la gente los tome en serio.
La pregunta
¿Es esta la respuesta a los problemas que el ASA identificó con valores p y pruebas de hipótesis nulas? ¿Puede realmente unir los paradigmas bayesiano y frequentista (como se afirma implícitamente en la respuesta)?
Respuestas:
He estado abogando por mi nuevo enfoque para la toma de decisiones estadísticas llamado RADD: R oll A D amn D ie. También aborda todos los puntos clave.
1) RADD puede indicar qué tan compatibles son los datos con un modelo estadístico especificado.
2) RADD puede decidir si una hipótesis es verdadera o no.
3) RADD puede usarse para tomar decisiones comerciales o políticas
4) RADD es transparente.
5) RADD mide la importancia del resultado.
6) RADD proporciona una buena medida de evidencia.
Entonces, no, STOP no es la respuesta. La respuesta es RADD.
fuente
fuente
Este excelente complemento al debate sobre el valor p, interesante pero también algo rancio en mi opinión, me recuerda un artículo único publicado hace algunos años en la edición navideña del British Medical Journal (BMJ), que cada Navidad publica una investigación real pero divertida artículos. En particular, este trabajo de Isaacs y Fitzgerald destacó siete alternativas clave a la medicina basada en evidencia (es decir, la práctica de la medicina basada en evidencia clínica y estadística real):
Lo más interesante es que debe mirar las columnas que resaltan los dispositivos de medición y las unidades de medida para los elementos anteriores (por ejemplo, audiómetro y decibelios para la medicina basada en vehemencia).
fuente