¿Puede alguien explicarme por qué alguien elegiría un método estadístico paramétrico en lugar de uno no paramétrico para pruebas de hipótesis o análisis de regresión?
En mi opinión, es como ir en balsa y elegir un reloj no resistente al agua, porque es posible que no lo mojes. ¿Por qué no usar la herramienta que funciona en cada ocasión?
Respuestas:
En raras ocasiones, si alguna vez una prueba paramétrica y una prueba no paramétrica en realidad tienen el mismo valor nulo. La prueba paramétrica está probando la media de la distribución, suponiendo que existan los dos primeros momentos. La prueba de suma de rango de Wilcoxon no supone ningún momento, y prueba la igualdad de distribuciones en su lugar. Su parámetro implícito es una extraña funcionalidad de distribuciones, la probabilidad de que la observación de una muestra sea más baja que la observación de la otra. Puede hablar de comparaciones entre las dos pruebas bajo el nulo completamente especificado de distribuciones idénticas ... pero debe reconocer que las dos pruebas están probando hipótesis diferentes.t
La información que aportan las pruebas paramétricas junto con su suposición ayuda a mejorar el poder de las pruebas. Por supuesto, es mejor que esa información sea correcta, pero hay pocos o ningún dominio del conocimiento humano en estos días donde no exista dicha información preliminar. Una excepción interesante que dice explícitamente "No quiero asumir nada" es la sala del tribunal donde los métodos no paramétricos siguen siendo muy populares, y tiene mucho sentido para la aplicación. Probablemente haya una buena razón, juego de palabras, para que Phillip Good haya escrito buenos libros sobre estadísticas no paramétricas y estadísticas de la corte .
También hay situaciones de prueba en las que no tiene acceso a los microdatos necesarios para la prueba no paramétrica. Supongamos que se le pide que compare dos grupos de personas para evaluar si uno es más obeso que el otro. En un mundo ideal, tendrá medidas de altura y peso para todos, y podría realizar una prueba de permutación estratificando por altura. En un mundo menos que ideal (es decir, real), es posible que solo tenga la altura y el peso promedio en cada grupo (o puede haber algunos rangos o variaciones de estas características en la parte superior de las medias de la muestra). Su mejor opción es calcular el IMC medio para cada grupo y compararlos si solo tiene los medios; o asuma una normalidad bivariada para la altura y el peso si tiene medias y variaciones (probablemente tendría que tomar una correlación de algunos datos externos si no vinieran con sus muestras),
fuente
Como otros han escrito: si se cumplen las condiciones previas, su prueba paramétrica será más poderosa que la no paramétrica.
En la analogía de su reloj, el no resistente al agua sería mucho más preciso a menos que se moje. Por ejemplo, su reloj resistente al agua podría estar apagado por una hora en ambos sentidos, mientras que el reloj no resistente al agua sería preciso ... y debe tomar un autobús después de su viaje en balsa. En tal caso, podría tener sentido llevar el reloj no resistente al agua y asegurarse de que no se moje.
Punto extra: los métodos no paramétricos no siempre son fáciles. Sí, una alternativa de prueba de permutación a prueba es simple. Pero una alternativa no paramétrica a un modelo lineal mixto con múltiples interacciones bidireccionales y efectos aleatorios anidados es bastante más difícil de configurar que una simple llamada a
nlme()
. Lo hice, usando pruebas de permutación, y en mi experiencia, los valores p de las pruebas paramétricas y de permutación siempre han estado bastante juntos, incluso si los residuos del modelo paramétrico eran bastante no normales. Las pruebas paramétricas suelen ser sorprendentemente resistentes frente a desviaciones de sus condiciones previas.fuente
Si bien estoy de acuerdo en que, en muchos casos, las técnicas no paramétricas son favorables, también hay situaciones en las que los métodos paramétricos son más útiles.
Centrémonos en la discusión "prueba t de dos muestras versus prueba de suma de rango de Wilcoxon" (de lo contrario, tenemos que escribir un libro completo).
fuente
En las pruebas de hipótesis, las pruebas no paramétricas a menudo prueban diferentes hipótesis, lo cual es una de las razones por las cuales no siempre se puede sustituir una prueba no paramétrica por una paramétrica.
De manera más general, los procedimientos paramétricos proporcionan una forma de imponer estructura en problemas que de otro modo no estarían estructurados. Esto es muy útil y puede verse como una especie de heurística simplificadora en lugar de una creencia de que el modelo es literalmente cierto. Tomemos, por ejemplo, el problema de predecir una respuesta continua basada en un vector de predictores utilizando alguna función de regresión (incluso suponiendo que dicha función exista es un tipo de restricción paramétrica). Si no asumimos absolutamente nada acerca dex f f f ( x ) = ∑ p j = 1 β j x jy x f f entonces no está nada claro cómo podemos proceder al estimar esta función. El conjunto de posibles respuestas que necesitamos buscar es demasiado grande. Pero si restringimos el espacio de respuestas posibles a (por ejemplo) el conjunto de funciones lineales , entonces podemos comenzar a progresar. No necesitamos creer que el modelo se mantenga exactamente, solo estamos haciendo una aproximación debido a la necesidad de llegar a alguna respuesta, por imperfecta que sea.f(x)=∑pj=1βjxj
fuente
Los modelos semiparamétricos tienen muchas ventajas. Ofrecen pruebas como la prueba de Wilcoxon como un caso especial, pero permiten la estimación de relaciones de efectos, cuantiles, medias y probabilidades de excedencia. Se extienden a datos longitudinales y censurados. Son robustos en el espacio Y y son invariantes de transformación, excepto por los medios de estimación. Consulte el enlace http://biostat.mc.vanderbilt.edu/rms a los folletos del curso para obtener un ejemplo detallado / estudio de caso.
A diferencia de los métodos totalmente paramétricos ( prueba , regresión múltiple ordinaria, modelos de efectos mixtos, modelos de supervivencia paramétricos, etc.), los métodos semiparamétricos para ordinal o continuo no suponen nada sobre la distribución de para una dada , ni siquiera que el La distribución es unimodal o suave. La distribución puede incluso tener picos severos en su interior o en los límites. Los modelos semiparamétricos suponen solo una conexión (p. Ej., Exponenciación en el caso de un modelo de Cox) entre distribuciones para dos configuraciones de covariables diferentes yY Y X X 1 X 2t Y Y X X1 X2 . Los ejemplos incluyen el modelo de probabilidades proporcionales (caso especial: Wilcoxon y Kruskal-Wallis) y el modelo de riesgos proporcionales (caso especial: log-rank y prueba estratificada de log-rank).
En efecto, los modelos semiparamétricos tienen muchas intersecciones. Estas intersecciones codifican la distribución de no paramétrica. Sin embargo, esto no crea ningún problema con la sobreparamización.Y
fuente
Entre la gran cantidad de respuestas proporcionadas, también llamaría la atención sobre las estadísticas bayesianas. Algunos problemas no pueden responderse solo con probabilidades. Un frequentista utiliza un razonamiento contrafactual en el que la "probabilidad" se refiere a universos alternativos y un marco de universo alternativo no tiene sentido en cuanto a inferir el estado de un individuo, como la culpabilidad o inocencia de un criminal, o si el cuello de botella de la frecuencia de genes en un Las especies expuestas a un cambio ambiental masivo llevaron a su extinción. En el contexto bayesiano, la probabilidad es "creencia", no frecuencia, que puede aplicarse a lo que ya ha precipitado.
Ahora, la mayoría de los métodos bayesianos requieren modelos de probabilidad de especificación completa para el previo y el resultado. Y, la mayoría de estos modelos de probabilidad son paramétricos. De acuerdo con lo que otros dicen, estos no necesitan ser exactamente correctos para producir resúmenes significativos de los datos. "Todos los modelos están equivocados, algunos modelos son útiles".
Hay, por supuesto, métodos bayesianos no paramétricos. Estos tienen muchas arrugas estadísticas y, en términos generales, requieren datos de población casi completos para ser utilizados de manera significativa.
fuente
La única razón por la que estoy respondiendo a pesar de todas las buenas respuestas anteriores es que nadie ha llamado la atención sobre la razón # 1 por la que usamos pruebas paramétricas (al menos en el análisis de datos de física de partículas). Porque sabemos la parametrización de los datos. Duh! Esa es una gran ventaja. Está reduciendo sus cientos, miles o millones de puntos de datos en los pocos parámetros que le interesan y describen su distribución. Estos le indican la física subyacente (o cualquier ciencia que le brinde sus datos).
Por supuesto, si no tiene idea de la densidad de probabilidad subyacente, entonces no tiene otra opción: usar pruebas no paramétricas. Las pruebas no paramétricas tienen la virtud de carecer de sesgos preconcebidos, pero pueden ser más difíciles de implementar, a veces mucho más.
fuente
¡Las estadísticas no paramétricas tienen sus propios problemas! Uno de ellos es el énfasis en la prueba de hipótesis, a menudo necesitamos intervalos de estimación y confianza, y obtenerlos en modelos complicados con parámetros no paramétricos es --- complicado. Hay una muy buena publicación de blog sobre esto, con discusión, en http://andrewgelman.com/2015/07/13/dont-do-the-wilcoxon/ La discusión conduce a esta otra publicación, http: // notstatschat. tumblr.com/post/63237480043/rock-paper-scissors-wilcoxon-test , que se recomienda para un punto de vista muy diferente sobre Wilcoxon. La versión corta es: el Wilcoxon (y otras pruebas de rango) pueden conducir a la no transmisión.
fuente
Diría que las estadísticas no paramétricas son más generalmente aplicables en el sentido de que hacen menos suposiciones que las estadísticas paramétricas.
Sin embargo, si uno usa estadísticas paramétricas y se cumplen los supuestos subyacentes, entonces las estadísticas paramétricas serán más poderosas que las no paramétricas.
fuente
Las estadísticas paramétricas son a menudo formas de incorporar conocimiento externo [a los datos]. Por ejemplo, usted sabe que la distribución del error es normal, y este conocimiento proviene de la experiencia previa o de alguna otra consideración y no del conjunto de datos. En este caso, al asumir una distribución normal, está incorporando este conocimiento externo en sus estimaciones de parámetros, lo que debe mejorar sus estimaciones.
En tu reloj analogía. En la actualidad, casi todos los relojes son resistentes al agua, excepto las piezas especiales con joyas o materiales inusuales como la madera. La razón para usarlos es precisamente eso: son especiales. Si te refieres a prueba de agua, entonces muchos relojes de vestir no son a prueba de agua. La razón para usarlos es nuevamente su función: no usarías un reloj de buceo con una suite y corbata. Además, en estos días, muchos relojes tienen la parte posterior abierta para que pueda disfrutar mirando el movimiento a través del cristal. Naturalmente, estos relojes generalmente no son a prueba de agua.
fuente
Este no es un escenario de prueba de hipótesis, pero puede ser un buen ejemplo para responder a su pregunta: consideremos el análisis de agrupamiento. Existen muchos métodos de agrupación "no paramétricos" como agrupación jerárquica, K-means, etc., pero el problema siempre es cómo evaluar si su solución de agrupación es "mejor" que otra solución posible (y a menudo existen múltiples soluciones posibles) . Cada algoritmo le brinda lo mejor que puede obtener, sin embargo, ¿cómo sabe si no hay nada mejor ...? Ahora, también hay enfoques paramétricos para la agrupación, llamada agrupación basada en modelos, como los modelos de mezclas finitas. Con FMM usted construye un modelo estadístico que describe la distribución de sus datos y los ajusta a los datos. Cuando tenga su modelo, puede evaluar qué tan probable es su información dado este modelo, puede usar pruebas de razón de probabilidad, comparar AIC y usar varios otros métodos para verificar el ajuste del modelo y la comparación del modelo. Los algoritmos de agrupamiento no paramétricos solo agrupan datos usando algunos criterios de similitud, mientras que con FMM le permiten describir e intentar comprender sus datos, verificar qué tan adecuado encaja, hacer predicciones ... En la práctica, los enfoques no paramétricos son simples, funcionan listos para usar y son bastante buenos, mientras que FMM puede ser problemático, pero aún así, los enfoques basados en modelos a menudo le proporcionan una salida más rica.
fuente
Las predicciones y pronósticos para nuevos datos son a menudo muy difíciles o imposibles para modelos no paramétricos. Por ejemplo, puedo pronosticar el número de reclamos de garantía para los próximos 10 años usando un modelo de supervivencia Weibull o Lognormal, sin embargo, esto no es posible usando el modelo Cox o Kaplan-Meier.
Editar: Déjame ser un poco más claro. Si una empresa tiene un producto defectuoso, a menudo está interesada en proyectar la tasa de reclamo de garantía futura y el CDF en función de los reclamos de garantía actuales y los datos de ventas. Esto puede ayudarlos a decidir si se necesita o no un retiro del mercado. No sé cómo haces esto usando un modelo no paramétrico.
fuente
Sinceramente, creo que no hay una respuesta correcta a esta pregunta. A juzgar por las respuestas dadas, el consenso es que las pruebas paramétricas son más potentes que los equivalentes no paramétricos. No cuestionaré este punto de vista, pero lo veo más como un punto de vista hipotético en lugar de factual, ya que no es algo que se enseñe explícitamente en las escuelas y ningún evaluador por pares le dirá "su documento fue rechazado porque utilizó pruebas no paramétricas". Esta pregunta es sobre algo que el mundo de las estadísticas no puede responder con claridad, pero ha dado por sentado.
Mi opinión personal es que la preferencia paramétrica o no paramétrica tiene más que ver con la tradición que con cualquier otra cosa (por falta de un término mejor). Las técnicas paramétricas para pruebas y predicciones estuvieron allí primero y tienen una larga historia, por lo que no es fácil ignorarlas completamente. La predicción, en particular, tiene algunas soluciones no paramétricas impresionantes que se utilizan ampliamente como herramienta de primera elección hoy en día. Creo que esta es una de las razones por las que las técnicas de aprendizaje automático, como las redes neuronales y los árboles de decisión, que no son paramétricos por naturaleza, han ganado una gran popularidad en los últimos años.
fuente
Es una cuestión de poder estadístico. Las pruebas no paramétricas generalmente tienen un poder estadístico más bajo que sus contrapartes paramétricas.
fuente
Muchas buenas respuestas ya, pero hay algunas razones que no he visto mencionadas:
Familiaridad. Dependiendo de su audiencia, el resultado paramétrico puede ser mucho más familiar que un resultado no paramétrico aproximadamente equivalente. Si los dos dan conclusiones similares, entonces la familiaridad es buena.
Sencillez. A veces, la prueba paramétrica es más sencilla de realizar y de informar. Algunos métodos no paramétricos son muy intensivos en informática. Por supuesto, las computadoras se han vuelto mucho más rápidas y los algoritmos también han mejorado, pero ... los datos se han vuelto "más grandes".
fuente