¿Por qué se preferirían las estadísticas paramétricas sobre las no paramétricas?

60

¿Puede alguien explicarme por qué alguien elegiría un método estadístico paramétrico en lugar de uno no paramétrico para pruebas de hipótesis o análisis de regresión?

En mi opinión, es como ir en balsa y elegir un reloj no resistente al agua, porque es posible que no lo mojes. ¿Por qué no usar la herramienta que funciona en cada ocasión?

en1
fuente
21
Es introducir un sesgo inductivo en el proceso de inferencia estadística. Esa es una manera elegante de decir: si sabes algo, proporciónalo como una pista. Esta sugerencia puede adoptar formas tales como proporcionar la forma funcional de probabilidad o distribución previa de los parámetros. Si su pista es buena, el resultado es mejor que sin una pista, y si es mala, el resultado es peor.
Cagdas Ozgenc
66
No necesariamente. Básicamente estás buscando algo en un postre muy grande. Si alguien te dice que lo que estás buscando está confinado en un territorio determinado, entonces tus posibilidades de encontrarlo mejoran. Pero si lo engañan con información incorrecta, no importa cuánto busque en ese territorio, no lo encontrará.
Cagdas Ozgenc
17
Como carpintero, me encanta la analogía al final. Las casas y los muebles que están bien construidos y últimos están construidos con herramientas especializadas. Las herramientas de uso general son excelentes para los propietarios de viviendas y para los profesionales que necesitan hacer un trabajo rápidamente o cuando el uso de una herramienta burda o inapropiada no hará una diferencia de calidad que a nadie le importe. Sin embargo, los artesanos logran los mejores resultados empleando la herramienta adecuada para el trabajo, y de hecho algunas cosas simplemente no se pueden hacer sin ella. Nadie hizo una buena cola de milano con una sierra de mano de uso general, por ejemplo.
whuber
3
Ya sea que caves una zanja con una pala o una cucharadita, terminarás con una zanja. Es solo que si usaste la cucharadita, también eres mayor.
conjugateprior
55
Relacionado (aunque quizás no sea tan obvio): si la media es tan sensible, ¿por qué usarla en primer lugar?
gung - Restablece a Monica

Respuestas:

25

En raras ocasiones, si alguna vez una prueba paramétrica y una prueba no paramétrica en realidad tienen el mismo valor nulo. La prueba paramétrica está probando la media de la distribución, suponiendo que existan los dos primeros momentos. La prueba de suma de rango de Wilcoxon no supone ningún momento, y prueba la igualdad de distribuciones en su lugar. Su parámetro implícito es una extraña funcionalidad de distribuciones, la probabilidad de que la observación de una muestra sea más baja que la observación de la otra. Puede hablar de comparaciones entre las dos pruebas bajo el nulo completamente especificado de distribuciones idénticas ... pero debe reconocer que las dos pruebas están probando hipótesis diferentes.t

La información que aportan las pruebas paramétricas junto con su suposición ayuda a mejorar el poder de las pruebas. Por supuesto, es mejor que esa información sea correcta, pero hay pocos o ningún dominio del conocimiento humano en estos días donde no exista dicha información preliminar. Una excepción interesante que dice explícitamente "No quiero asumir nada" es la sala del tribunal donde los métodos no paramétricos siguen siendo muy populares, y tiene mucho sentido para la aplicación. Probablemente haya una buena razón, juego de palabras, para que Phillip Good haya escrito buenos libros sobre estadísticas no paramétricas y estadísticas de la corte .

También hay situaciones de prueba en las que no tiene acceso a los microdatos necesarios para la prueba no paramétrica. Supongamos que se le pide que compare dos grupos de personas para evaluar si uno es más obeso que el otro. En un mundo ideal, tendrá medidas de altura y peso para todos, y podría realizar una prueba de permutación estratificando por altura. En un mundo menos que ideal (es decir, real), es posible que solo tenga la altura y el peso promedio en cada grupo (o puede haber algunos rangos o variaciones de estas características en la parte superior de las medias de la muestra). Su mejor opción es calcular el IMC medio para cada grupo y compararlos si solo tiene los medios; o asuma una normalidad bivariada para la altura y el peso si tiene medias y variaciones (probablemente tendría que tomar una correlación de algunos datos externos si no vinieran con sus muestras),

StasK
fuente
3
Entiendo que en el caso de las pruebas no tiene el mismo valor nulo, aunque no estoy seguro de si tiene sentido decir que un valor nulo es mejor que otro valor nulo. ¿Pero qué pasa con el caso de la predicción? Historia completamente diferente, todavía paramétrico vs. dilema no paramétrico.
en1
22

Como otros han escrito: si se cumplen las condiciones previas, su prueba paramétrica será más poderosa que la no paramétrica.

En la analogía de su reloj, el no resistente al agua sería mucho más preciso a menos que se moje. Por ejemplo, su reloj resistente al agua podría estar apagado por una hora en ambos sentidos, mientras que el reloj no resistente al agua sería preciso ... y debe tomar un autobús después de su viaje en balsa. En tal caso, podría tener sentido llevar el reloj no resistente al agua y asegurarse de que no se moje.


Punto extra: los métodos no paramétricos no siempre son fáciles. Sí, una alternativa de prueba de permutación a prueba es simple. Pero una alternativa no paramétrica a un modelo lineal mixto con múltiples interacciones bidireccionales y efectos aleatorios anidados es bastante más difícil de configurar que una simple llamada a nlme(). Lo hice, usando pruebas de permutación, y en mi experiencia, los valores p de las pruebas paramétricas y de permutación siempre han estado bastante juntos, incluso si los residuos del modelo paramétrico eran bastante no normales. Las pruebas paramétricas suelen ser sorprendentemente resistentes frente a desviaciones de sus condiciones previas.

S. Kolassa - Restablece a Monica
fuente
Parece ser la opinión predominante de que los métodos paramétricos son más poderosos cuando se cumplen sus supuestos. Pero si ese es el caso, ¿por qué tenemos valores p para evaluar los resultados de ambos enfoques? Quiero decir, si una prueba paramétrica rechaza una hipótesis nula con una probabilidad de al menos el 99%, ¿cómo es mejor que una prueba no paramétrica rechace una hipótesis nula con una probabilidad del 99%? ¿La probabilidad de 0,99 es diferente en cada caso? Eso no tendría sentido.
en1
1
Las hipótesis nulas son diferentes entre una prueba paramétrica y su contraparte no paramétrica. Específicamente, la hipótesis nula para una prueba paramétrica contiene una suposición paramétrica específica sobre la distribución del estadístico de prueba (que generalmente también se calculará de diferentes maneras para las dos pruebas), ¡por eso se llama "paramétrica", después de todo! Por lo tanto, los dos valores de p tienen el mismo nombre, pero se calculan en función de diferentes estadísticas de prueba, que tienen diferentes distribuciones bajo diferentes hipótesis nulas.
S. Kolassa - Restablece a Monica el
... y @StasK lo expresó todo mucho mejor que yo .
S. Kolassa - Restablece a Monica el
3
@StephanKolassa, en realidad comencé a escribir un comentario a tu respuesta, y me
dejé
12

Si bien estoy de acuerdo en que, en muchos casos, las técnicas no paramétricas son favorables, también hay situaciones en las que los métodos paramétricos son más útiles.

Centrémonos en la discusión "prueba t de dos muestras versus prueba de suma de rango de Wilcoxon" (de lo contrario, tenemos que escribir un libro completo).

  1. Con tamaños de grupo pequeños de 2-3, solo la prueba t puede alcanzar teóricamente valores de p inferiores al 5%. En biología y química, los tamaños de grupos como este no son infrecuentes. Por supuesto, es delicado usar una prueba t en tal entorno. Pero tal vez es mejor que nada. (Este punto está relacionado con el problema de que, en circunstancias perfectas, la prueba t tiene más potencia que la prueba de Wilcoxon).
  2. Con tamaños de grupo enormes, también se puede ver una prueba t como no paramétrica gracias al Teorema del límite central.
  3. Los resultados de la prueba t están en línea con el intervalo de confianza de Student para la diferencia de medias.
  4. Si las variaciones varían mucho entre los grupos, la versión de Welch de la prueba t intenta tener esto en cuenta, mientras que la prueba de suma de rangos de Wilcoxon puede fallar gravemente si se comparan las medias (por ejemplo, probabilidad de error del primer tipo muy diferente del nivel nominal )
Michael M
fuente
2
No estaría de acuerdo con 1. Simplemente usar un procedimiento porque le permite tomar una decisión no es realmente una buena razón, especialmente cuando no tiene ninguna razón para esperar que ese procedimiento sea válido. Si tiene poca o ninguna información, simplemente haga un juicio y no pretenda que se basa en el rigor.
dsaxton
55
Estoy de acuerdo contigo. Es claramente una de las razones por las que los resultados a menudo no son reproducibles, incluso si se publican en las revistas mejor calificadas. Pero, ¿qué opciones tiene como investigador si el presupuesto solo permite muestras pequeñas?
Michael M
1
Re 4 y los problemas de aplicación de Wilcoxon-Mann-Whitney cuando existen diferencias desiguales entre los grupos, existen métodos no paramétricos que permiten la heterocedasticidad: parece recordar la prueba de Cliff o la prueba de Brunner-Munzel, por ejemplo. (No creo que tengamos mucha información sobre ellos en este sitio.)
Silverfish
@Silverfish: con frecuencia uso los métodos de Brunner y creo que tienes razón. Pero dudo que realmente estén comparando medios exentos al hacer suposiciones de distribución fuertes.
Michael M
1
@MichaelM Sí, por supuesto, eso vuelve a la cuestión de los métodos paramétricos y no paramétricos que tienen diferentes hipótesis, supongo.
Silverfish
9

En las pruebas de hipótesis, las pruebas no paramétricas a menudo prueban diferentes hipótesis, lo cual es una de las razones por las cuales no siempre se puede sustituir una prueba no paramétrica por una paramétrica.

De manera más general, los procedimientos paramétricos proporcionan una forma de imponer estructura en problemas que de otro modo no estarían estructurados. Esto es muy útil y puede verse como una especie de heurística simplificadora en lugar de una creencia de que el modelo es literalmente cierto. Tomemos, por ejemplo, el problema de predecir una respuesta continua basada en un vector de predictores utilizando alguna función de regresión (incluso suponiendo que dicha función exista es un tipo de restricción paramétrica). Si no asumimos absolutamente nada acerca dex f f f ( x ) = p j = 1 β j x jyxffentonces no está nada claro cómo podemos proceder al estimar esta función. El conjunto de posibles respuestas que necesitamos buscar es demasiado grande. Pero si restringimos el espacio de respuestas posibles a (por ejemplo) el conjunto de funciones lineales , entonces podemos comenzar a progresar. No necesitamos creer que el modelo se mantenga exactamente, solo estamos haciendo una aproximación debido a la necesidad de llegar a alguna respuesta, por imperfecta que sea.f(x)=j=1pβjxj

dsaxton
fuente
Sí, y eso agrega un sesgo de modelo. ¿Qué dice eso sobre los valores p que informan los investigadores?
Cagdas Ozgenc
@dsaxton lo que dices es cierto sobre probar diferentes hipótesis, pero la gente todavía las interpreta de la misma manera. Luego también está la regresión, donde las ideas que obtienes entre análisis no paramétricos y paramétricos son más o menos las mismas.
en1
@ cagdas-ozgenc Le dice que los valores p están condicionados al modelo. Pero no está claro cómo podrían ser las cosas de otra manera ...
conjugateprior
3
+1 por notar que no tenemos absolutamente ninguna posibilidad de estimar nada de valor en una regresión sin algunos supuestos sobre la función de regresión.
conjugateprior
9

Los modelos semiparamétricos tienen muchas ventajas. Ofrecen pruebas como la prueba de Wilcoxon como un caso especial, pero permiten la estimación de relaciones de efectos, cuantiles, medias y probabilidades de excedencia. Se extienden a datos longitudinales y censurados. Son robustos en el espacio Y y son invariantes de transformación, excepto por los medios de estimación. Consulte el enlace http://biostat.mc.vanderbilt.edu/rms a los folletos del curso para obtener un ejemplo detallado / estudio de caso.

A diferencia de los métodos totalmente paramétricos ( prueba , regresión múltiple ordinaria, modelos de efectos mixtos, modelos de supervivencia paramétricos, etc.), los métodos semiparamétricos para ordinal o continuo no suponen nada sobre la distribución de para una dada , ni siquiera que el La distribución es unimodal o suave. La distribución puede incluso tener picos severos en su interior o en los límites. Los modelos semiparamétricos suponen solo una conexión (p. Ej., Exponenciación en el caso de un modelo de Cox) entre distribuciones para dos configuraciones de covariables diferentes yY Y X X 1 X 2tYYXX1X2. Los ejemplos incluyen el modelo de probabilidades proporcionales (caso especial: Wilcoxon y Kruskal-Wallis) y el modelo de riesgos proporcionales (caso especial: log-rank y prueba estratificada de log-rank).

En efecto, los modelos semiparamétricos tienen muchas intersecciones. Estas intersecciones codifican la distribución de no paramétrica. Sin embargo, esto no crea ningún problema con la sobreparamización.Y

Frank Harrell
fuente
1
He estado luchando con esto un poco. ¿Considera que la prueba t es semiparamétrica o no paramétrica? Por un lado, siempre he asumido que la 'jist' de los semi-paramétricos es la siguiente: tomar un modelo de probabilidad "funcional" para los datos, estimar los parámetros en esa distribución independientemente de si la distribución es correcta y mejorar la estimación de errores para explicar la incertidumbre (Entonces, los errores basados ​​en sandwich para soluciones a las ecuaciones de puntuación gaussianas serían una prueba T semiparamétrica). Sin embargo, los semi-paramétricos casi siempre involucran parcializar / condicionar algo, como con los modelos Cox.
AdamO
Agregaré más descripción a mi respuesta para lidiar con eso.
Frank Harrell
6

Entre la gran cantidad de respuestas proporcionadas, también llamaría la atención sobre las estadísticas bayesianas. Algunos problemas no pueden responderse solo con probabilidades. Un frequentista utiliza un razonamiento contrafactual en el que la "probabilidad" se refiere a universos alternativos y un marco de universo alternativo no tiene sentido en cuanto a inferir el estado de un individuo, como la culpabilidad o inocencia de un criminal, o si el cuello de botella de la frecuencia de genes en un Las especies expuestas a un cambio ambiental masivo llevaron a su extinción. En el contexto bayesiano, la probabilidad es "creencia", no frecuencia, que puede aplicarse a lo que ya ha precipitado.

Ahora, la mayoría de los métodos bayesianos requieren modelos de probabilidad de especificación completa para el previo y el resultado. Y, la mayoría de estos modelos de probabilidad son paramétricos. De acuerdo con lo que otros dicen, estos no necesitan ser exactamente correctos para producir resúmenes significativos de los datos. "Todos los modelos están equivocados, algunos modelos son útiles".

Hay, por supuesto, métodos bayesianos no paramétricos. Estos tienen muchas arrugas estadísticas y, en términos generales, requieren datos de población casi completos para ser utilizados de manera significativa.

AdamO
fuente
6

La única razón por la que estoy respondiendo a pesar de todas las buenas respuestas anteriores es que nadie ha llamado la atención sobre la razón # 1 por la que usamos pruebas paramétricas (al menos en el análisis de datos de física de partículas). Porque sabemos la parametrización de los datos. Duh! Esa es una gran ventaja. Está reduciendo sus cientos, miles o millones de puntos de datos en los pocos parámetros que le interesan y describen su distribución. Estos le indican la física subyacente (o cualquier ciencia que le brinde sus datos).

Por supuesto, si no tiene idea de la densidad de probabilidad subyacente, entonces no tiene otra opción: usar pruebas no paramétricas. Las pruebas no paramétricas tienen la virtud de carecer de sesgos preconcebidos, pero pueden ser más difíciles de implementar, a veces mucho más.

Variante de tiempo
fuente
5

¡Las estadísticas no paramétricas tienen sus propios problemas! Uno de ellos es el énfasis en la prueba de hipótesis, a menudo necesitamos intervalos de estimación y confianza, y obtenerlos en modelos complicados con parámetros no paramétricos es --- complicado. Hay una muy buena publicación de blog sobre esto, con discusión, en http://andrewgelman.com/2015/07/13/dont-do-the-wilcoxon/ La discusión conduce a esta otra publicación, http: // notstatschat. tumblr.com/post/63237480043/rock-paper-scissors-wilcoxon-test , que se recomienda para un punto de vista muy diferente sobre Wilcoxon. La versión corta es: el Wilcoxon (y otras pruebas de rango) pueden conducir a la no transmisión.

kjetil b halvorsen
fuente
44
No estoy seguro de que la transitividad sea el final y todo. Y puede invertir la prueba de Wilcoxon para obtener un intervalo de confianza de estimador de ubicación muy robusto y útil.
Frank Harrell
2
La no transmisión tiene sus puntos en el modelado causal, pero para las pruebas de asociación de dos muestras simples, no creo que sea realmente un problema. Además, no veo las diferencias en las pruebas de hipótesis / estimación / intervalos de confianza entre los métodos no paramétricos y paramétricos. A veces, con una estimación robusta, se usa un modelo de probabilidad de trabajo para que la estimación paramétrica correspondiente proporcione un resumen significativo de los datos (incluso si no es el modelo de probabilidad correcto per se). ¿Quizás pueda ampliar esta respuesta?
AdamO
2
Por lo general, se hacen algunas suposiciones adicionales para la prueba de Wilcoxon, por ejemplo, el dominio estocástico de un grupo sobre el otro, que de ser cierto recuperar la transitividad.
Scortchi - Restablece a Monica
3

Diría que las estadísticas no paramétricas son más generalmente aplicables en el sentido de que hacen menos suposiciones que las estadísticas paramétricas.

Sin embargo, si uno usa estadísticas paramétricas y se cumplen los supuestos subyacentes, entonces las estadísticas paramétricas serán más poderosas que las no paramétricas.


fuente
2

Las estadísticas paramétricas son a menudo formas de incorporar conocimiento externo [a los datos]. Por ejemplo, usted sabe que la distribución del error es normal, y este conocimiento proviene de la experiencia previa o de alguna otra consideración y no del conjunto de datos. En este caso, al asumir una distribución normal, está incorporando este conocimiento externo en sus estimaciones de parámetros, lo que debe mejorar sus estimaciones.

En tu reloj analogía. En la actualidad, casi todos los relojes son resistentes al agua, excepto las piezas especiales con joyas o materiales inusuales como la madera. La razón para usarlos es precisamente eso: son especiales. Si te refieres a prueba de agua, entonces muchos relojes de vestir no son a prueba de agua. La razón para usarlos es nuevamente su función: no usarías un reloj de buceo con una suite y corbata. Además, en estos días, muchos relojes tienen la parte posterior abierta para que pueda disfrutar mirando el movimiento a través del cristal. Naturalmente, estos relojes generalmente no son a prueba de agua.

Aksakal
fuente
1
¡Me gusta esta metáfora! Recuerdo que un profesor nos dijo que deberíamos probar diferentes métodos estadísticos sobre la misma cosa para ver si podemos obtener los mismos resultados.
Deep North
2

Este no es un escenario de prueba de hipótesis, pero puede ser un buen ejemplo para responder a su pregunta: consideremos el análisis de agrupamiento. Existen muchos métodos de agrupación "no paramétricos" como agrupación jerárquica, K-means, etc., pero el problema siempre es cómo evaluar si su solución de agrupación es "mejor" que otra solución posible (y a menudo existen múltiples soluciones posibles) . Cada algoritmo le brinda lo mejor que puede obtener, sin embargo, ¿cómo sabe si no hay nada mejor ...? Ahora, también hay enfoques paramétricos para la agrupación, llamada agrupación basada en modelos, como los modelos de mezclas finitas. Con FMM usted construye un modelo estadístico que describe la distribución de sus datos y los ajusta a los datos. Cuando tenga su modelo, puede evaluar qué tan probable es su información dado este modelo, puede usar pruebas de razón de probabilidad, comparar AIC y usar varios otros métodos para verificar el ajuste del modelo y la comparación del modelo. Los algoritmos de agrupamiento no paramétricos solo agrupan datos usando algunos criterios de similitud, mientras que con FMM le permiten describir e intentar comprender sus datos, verificar qué tan adecuado encaja, hacer predicciones ... En la práctica, los enfoques no paramétricos son simples, funcionan listos para usar y son bastante buenos, mientras que FMM puede ser problemático, pero aún así, los enfoques basados ​​en modelos a menudo le proporcionan una salida más rica.

Tim
fuente
2

Las predicciones y pronósticos para nuevos datos son a menudo muy difíciles o imposibles para modelos no paramétricos. Por ejemplo, puedo pronosticar el número de reclamos de garantía para los próximos 10 años usando un modelo de supervivencia Weibull o Lognormal, sin embargo, esto no es posible usando el modelo Cox o Kaplan-Meier.

Editar: Déjame ser un poco más claro. Si una empresa tiene un producto defectuoso, a menudo está interesada en proyectar la tasa de reclamo de garantía futura y el CDF en función de los reclamos de garantía actuales y los datos de ventas. Esto puede ayudarlos a decidir si se necesita o no un retiro del mercado. No sé cómo haces esto usando un modelo no paramétrico.

Cañada
fuente
77
Siento disentir. Puede usar un modelo de Cox para estimar cuantiles, la media (si el valor Y más alto no está censurado) y todo tipo de probabilidades. Sin embargo, no ser capaz de pronosticar más allá del rango de los datos es un problema (como mencionó), pero podría estar extrapolando peligrosamente.
Frank Harrell
@FrankHarrell Sí, buen punto, siempre debe tener cuidado al extrapolar.
Glen
¿Qué pasa con Random Forest, Deep Learning o SVM? Vencen a la mayoría, si no a todos, los métodos paramétricos de predicción.
en1
2
Excepto intentar y hacer que un árbol de decisión aprenda un límite diagonal
bill_e
1

Sinceramente, creo que no hay una respuesta correcta a esta pregunta. A juzgar por las respuestas dadas, el consenso es que las pruebas paramétricas son más potentes que los equivalentes no paramétricos. No cuestionaré este punto de vista, pero lo veo más como un punto de vista hipotético en lugar de factual, ya que no es algo que se enseñe explícitamente en las escuelas y ningún evaluador por pares le dirá "su documento fue rechazado porque utilizó pruebas no paramétricas". Esta pregunta es sobre algo que el mundo de las estadísticas no puede responder con claridad, pero ha dado por sentado.

Mi opinión personal es que la preferencia paramétrica o no paramétrica tiene más que ver con la tradición que con cualquier otra cosa (por falta de un término mejor). Las técnicas paramétricas para pruebas y predicciones estuvieron allí primero y tienen una larga historia, por lo que no es fácil ignorarlas completamente. La predicción, en particular, tiene algunas soluciones no paramétricas impresionantes que se utilizan ampliamente como herramienta de primera elección hoy en día. Creo que esta es una de las razones por las que las técnicas de aprendizaje automático, como las redes neuronales y los árboles de decisión, que no son paramétricos por naturaleza, han ganado una gran popularidad en los últimos años.

Digio
fuente
3
"el consenso es que las pruebas paramétricas son más potentes que las no paramétricas": las pruebas no paramétricas generalmente tienen una potencia más baja cuando los supuestos de la prueba paramétrica son correctos , esencialmente porque esos supuestos significan que las pruebas paramétricas tienen un comienzo (información adicional sobre la distribución verdadera) . Pero especialmente en muestras grandes, la pérdida de potencia puede ser pequeña : Wilcoxon es tan eficiente como la prueba t en muestras grandes si la normalidad se mantiene. Si no se cumplen los supuestos, las pruebas no paramétricas pueden ser mucho más potentes. 3/π95%
Silverfish
'Consenso' significa 'acuerdo general', no mi opinión personal.
Digio
2
No me refería a si la declaración representaba su propia opinión personal o la sabiduría colectiva de los demás, solo señalaba que la declaración solo es correcta si las condiciones necesarias para una prueba paramétrica son ciertas . Cuando las condiciones no se cumplen, puede que ya no sea el caso de que "las pruebas paramétricas son más potentes que las no paramétricas", y de hecho lo contrario puede ser el caso (a veces por un margen muy amplio).
Silverfish
Touché! ..... +1
Digio
0

Es una cuestión de poder estadístico. Las pruebas no paramétricas generalmente tienen un poder estadístico más bajo que sus contrapartes paramétricas.

Modelo oculto de Markov
fuente
66
Las pruebas paramétricas tendrán más poder cuando se cumplan sus supuestos. Cuando no se cumplen sus supuestos, las pruebas no paramétricas pueden ser más potentes.
gung - Restablece a Monica
3
Esta respuesta es muy corta, y el poder se ha discutido en respuestas anteriores. ¿Considerarías expandirlo un poco?
Scortchi - Restablece a Monica
44
La ganancia de potencia de las pruebas paramétricas es minúscula en comparación con la pérdida de potencia que sufren cuando no se cumplen sus supuestos.
Frank Harrell
Frank, depende de la prueba, algunas pruebas son más robustas a las violaciones de sus supuestos.
Modelo oculto de Markov el
0

Muchas buenas respuestas ya, pero hay algunas razones que no he visto mencionadas:

  1. Familiaridad. Dependiendo de su audiencia, el resultado paramétrico puede ser mucho más familiar que un resultado no paramétrico aproximadamente equivalente. Si los dos dan conclusiones similares, entonces la familiaridad es buena.

  2. Sencillez. A veces, la prueba paramétrica es más sencilla de realizar y de informar. Algunos métodos no paramétricos son muy intensivos en informática. Por supuesto, las computadoras se han vuelto mucho más rápidas y los algoritmos también han mejorado, pero ... los datos se han vuelto "más grandes".

    1. A veces, lo que generalmente es una desventaja de la prueba paramétrica es en realidad una ventaja, aunque esto es específico para pares particulares de pruebas. Por ejemplo, soy, en general, un fanático de la regresión cuantil, ya que hace menos suposiciones que los métodos habituales. Pero a veces realmente necesitas estimar la media, en lugar de la mediana.
Peter Flom - Restablece a Monica
fuente