Interpretación de pruebas paramétricas y no paramétricas

8

Busqué en preguntas sobre distinciones de pruebas paramétricas y no paramétricas y parece que todas las preguntas se centran en una prueba muy específica, un problema de datos o alguna distinción técnica. No estoy interesado en el tema de probar supuestos (no; examinar en su lugar), o los problemas de potencia o tasas de error.

Mi pregunta es sobre la interpretación de los dos tipos de pruebas. ¿Hay alguna distinción entre cómo se interpreta el resultado de la prueba entre paramétrico y no paramétrico? Si está ejecutando una prueba no paramétrica, está debilitando (eliminando) los caminos hacia la discusión de la población desconocida, por lo que parece que quizás tenga más limitaciones para analizar el resultado de la prueba. Si ejecuta una prueba paramétrica, sus conexiones con la población están condicionadas a los supuestos. ¿Cuáles son las interpretaciones adecuadas de cada prueba y son importantes estas distinciones?

Juan
fuente

Respuestas:

6

Esta es una buena oportunidad para discutir y aclarar qué significan los modelos estadísticos y cómo debemos pensar en ellos. Comencemos con las definiciones, para que el alcance de esta respuesta no tenga dudas, y avancemos desde allí. Para mantener esta publicación breve, limitaré los ejemplos y renunciaré a todas las ilustraciones, confiando en que el lector pueda proporcionarlas por experiencia.

Definiciones

Parece posible entender "prueba" en un sentido muy general como cualquier tipo de procedimiento estadístico: no solo una prueba de hipótesis nula, sino también una estimación, predicción y toma de decisiones, ya sea en un marco frequentista o bayesiano. Esto se debe a que la distinción entre "paramétrico" y "no paramétrico" está separada de las distinciones entre tipos de procedimientos o distinciones entre estos marcos.

En cualquier caso, lo que hace que un procedimiento sea estadístico es que modela el mundo con distribuciones de probabilidad cuyas características no se conocen completamente. De manera muy abstracta, concebimos datosX como surgiendo codificando numéricamente los valores de los objetos ωΩ; los datos particulares que estamos utilizando corresponden a un particularω; y hay una ley de probabilidadF que de alguna manera determinó el ω En realidad tenemos.

Se supone que esta ley de probabilidad pertenece a algún conjunto Θ. En una configuración paramétrica , los elementosFΘ corresponden a colecciones finitas de números θ(F), los parámetros En una configuración no paramétrica , no existe tal correspondencia. Esto generalmente se debe a que no estamos dispuestos a hacer suposiciones fuertes sobreF.

La naturaleza de los modelos

Parece útil hacer una nueva distinción que rara vez se discute. En algunas circunstancias,Fseguramente será un modelo totalmente preciso para los datos. En lugar de definir lo que quiero decir con "totalmente exacto", permítanme dar un ejemplo. Realice una encuesta de una población finita y bien definida en la que las observaciones son binarias, no faltará ninguna y no hay posibilidad de error de medición. Un ejemplo podría ser la prueba destructiva de una muestra aleatoria de objetos que salen de una línea de ensamblaje, por ejemplo. El control que tenemos sobre esta situación, conocer la población y poder seleccionar la muestra de manera realmente aleatoria, asegura la exactitud de un modelo binomial para los recuentos resultantes.

En muchos, quizás la mayoría, otros casos, Θno es "completamente exacto". Por ejemplo, muchos análisis suponen (ya sea implícita o explícitamente) queFEs una distribución normal. Eso siempre es físicamente imposible, porque cualquier medición real está sujeta a restricciones físicas en su rango posible, mientras que no existen tales restricciones en las distribuciones normales. ¡Sabemos desde el principio que las suposiciones normales están mal!

¿En qué medida es un problema un modelo no totalmente exacto? Considere lo que hacen los buenos físicos. Cuando un físico usa la mecánica newtoniana para resolver un problema, es porque ella sabe que a esta escala particular, estas masas, estas distancias, estas velocidades, la mecánica newtoniana es más que precisa para funcionar. Ella elegirá complicar su análisis al considerar los efectos cuánticos o relativistas (o ambos) solo cuando el problema lo requiera. Ella está familiarizada con los teoremas que muestran, cuantitativamente, cómo la mecánica newtoniana es un caso limitante de la mecánica cuántica y de la relatividad especial. Esos teoremas le ayudan a entender qué teoría elegir. Esta selección generalmente no está documentada ni siquiera defendida; incluso puede ocurrir inconscientemente: la elección es obvia.

Un buen estadístico siempre tiene en mente consideraciones comparables. Cuando selecciona un procedimiento cuya justificación se basa en un supuesto de Normalidad, por ejemplo, está sopesando hasta qué puntoFpodría apartarse del comportamiento normal y cómo eso podría afectar el procedimiento. En muchos casos, el efecto probable es tan pequeño que ni siquiera necesita cuantificarse: ella "asume la normalidad". En otros casos, el efecto probable es desconocido. En tales circunstancias, realizará pruebas de diagnóstico para evaluar las desviaciones de la Normalidad y sus efectos en los resultados.

Consecuencias

Está comenzando a sonar como si la configuración no completamente precisa no fuera muy distinta de la no paramétrica: ¿hay realmente alguna diferencia entre asumir un modelo paramétrico y evaluar cómo la realidad se aparta de él, por un lado, y asumir un modelo no paramétrico? ¿por otra parte? En el fondo, ambos no son paramétricos.

A la luz de esta discusión, reconsideremos las distinciones convencionales entre procedimientos paramétricos y no paramétricos.

  • "Los procedimientos no paramétricos son robustos". Entonces, hasta cierto punto, todos los procedimientos deben ser. El problema no es la robustez frente a la no robustez, sino la solidez de cualquier procedimiento. ¿Cuánto y de qué manera lo verdaderoF apartarse de las distribuciones en el supuesto Θ? En función de esas salidas, ¿cuánto se ven afectados los resultados de la prueba? Estas son preguntas básicas que se aplican en cualquier entorno, paramétrico o no.

  • "Los procedimientos no paramétricos no requieren pruebas de bondad de ajuste o pruebas de distribución". Esto no es generalmente cierto. "No paramétrico" a menudo se caracteriza erróneamente como "libre de distribución", en el sentido de permitirFser literalmente cualquier distribución, pero este casi nunca es el caso. Casi todos los procedimientos no paramétricos hacen suposiciones que restringenΘ. Por ejemplo,X podría dividirse en dos conjuntos para comparar, con una distribución F0 gobernando un conjunto y otra distribución F1gobernando el otro. Quizás no se asume nada sobreF0, peroF1 se supone que es una versión traducida de F0. Eso es lo que asumen muchas comparaciones de tendencia central. El punto es que no es una suposición definida hecho sobreF en tales pruebas y merece ser verificado tanto como cualquier supuesto paramétrico podría ser.

  • "Los procedimientos no paramétricos no hacen suposiciones". Hemos visto que lo hacen. Solo tienden a hacer suposiciones menos restrictivas que los procedimientos paramétricos.

Un enfoque indebido en paramétrico vs no paramétrico podría ser un enfoque contraproducente. Pasa por alto el objetivo principal de los procedimientos estadísticos, que es mejorar la comprensión, tomar buenas decisiones o tomar las medidas adecuadas. Los procedimientos estadísticos se seleccionan en función de qué tan bien se puede esperar que funcionen en el contexto del problema, a la luz de toda otra información y suposiciones sobre el problema, y ​​con respecto a las consecuencias para todos los interesados ​​en el resultado.

Por lo tanto, la respuesta a "¿importan estas distinciones?" Parece ser "no realmente".

whuber
fuente