¿Hay alguna prueba estadística que sea paramétrica y no paramétrica?

20

¿Hay alguna prueba estadística que sea paramétrica y no paramétrica? Esta pregunta fue formulada por un panel de entrevista. ¿Es una pregunta válida?

Biostat
fuente
1
Estudiar la entrada de Wikipedia para estadísticas no paramétricas podría ser suficiente para prepararte para un entrevistador. Puede responder la pregunta con una pregunta, como en "¿qué quiere decir con no paramétrico? ¿Modelos sin distribución o estadísticas de orden de rango?"
jrhorn424
3
Como punto de partida, podría ayudarlo a usted, así como a sus encuestados, consultar a una autoridad (¡ no a Internet!) En relación con las definiciones. "Los casos paramétricos ... son todos aquellos en los que la clase de todos los [estados de la naturaleza] puede representarse en términos de un vector consiste en un número finito de componentes reales de forma natural. (... la distribución y la función de pérdida dependen de de una manera razonablemente suave.) Todos los demás problemas se denominan no paramétricos . - JC Kiefer, Introducción a la inferencia estadística, p. 23.θθ
whuber
Uno de los profesores me dijo que la 'prueba de Chi-cuadrado' tiene ambos comportamientos (es decir, paramétricos y no paramétricos también). No entendí en absoluto, por qué la 'prueba de chi cuadrado' tiene ambos comportamientos.
Biostat el
3
No es la prueba paramétrica, es el modelo que es. Las distribuciones de chi-cuadrado surgen en ambas situaciones (de forma natural en el modelo lineal general con supuestos de distribución Normal, y como una aproximación para una diferencia de probabilidades de registro, ambas aplicaciones paramétricas) y también como una aproximación para el multinomio distribuciones que surgen en muchas aplicaciones no paramétricas), por lo que hay muchas pruebas diferentes que comparten el nombre "chi-cuadrado". Esto es probablemente lo que sugirió el comentario de tu profesor.
whuber
@whuber: ¿Su último comentario significa que la prueba de chi-cuadrado para la bondad del ajuste no es paramétrica?
Tim

Respuestas:

6

Es fundamentalmente difícil determinar exactamente qué se entiende por "prueba paramétrica" ​​y "prueba no paramétrica", aunque existen muchos ejemplos concretos en los que la mayoría estará de acuerdo en si una prueba es paramétrica o no paramétrica (pero nunca ambas) . Una búsqueda rápida dio esta tabla , que imagino representa una distinción práctica común en algunas áreas entre pruebas paramétricas y no paramétricas.

Justo encima de la tabla mencionada hay una observación:

"... los datos paramétricos tienen una distribución normal subyacente ... Cualquier otra cosa no es paramétrica".

Puede ser un criterio aceptado en algunas áreas que asumimos normalidad y usamos ANOVA, y esto es paramétrico, o no asumimos normalidad y usamos alternativas no paramétricas.

Quizás no sea una muy buena definición, y en mi opinión no es realmente correcta, pero puede ser una regla práctica. Principalmente porque el objetivo final de las ciencias sociales, por ejemplo, es analizar los datos, y ¿de qué sirve poder formular un modelo paramétrico basado en una distribución no normal y luego no poder analizar los datos?

Una definición alternativa es definir "pruebas no paramétricas" como pruebas que no se basan en suposiciones de distribución y pruebas paramétricas como cualquier otra cosa.

La definición anterior, así como la última presentada, define una clase de pruebas y luego define la otra clase como el complemento (cualquier otra cosa). Por definición, esto descarta que una prueba pueda ser paramétrica y no paramétrica.

La verdad es que también la última definición es problemática. ¿Qué pasa si hay ciertas suposiciones naturales "no paramétricas", como la simetría, que se pueden imponer? ¿Eso convertirá una estadística de prueba que, de lo contrario, no se basa en supuestos de distribución en una prueba paramétrica? ¡La mayoría diría que no!

Por lo tanto, hay pruebas en la clase de pruebas no paramétricas que pueden hacer algunas suposiciones de distribución siempre que no sean "demasiado paramétricas". El límite entre las pruebas "paramétricas" y las "no paramétricas" se ha vuelto borroso, pero creo que la mayoría mantendrá que una prueba es paramétrica o no es paramétrica, tal vez no puede ser ninguna de las dos, pero decir que es ambas Tiene poco sentido.-

Tomando un punto de vista diferente, muchas pruebas paramétricas son (equivalentes a) pruebas de razón de probabilidad. Esto hace posible una teoría general, y tenemos una comprensión unificada de las propiedades de distribución de las pruebas de razón de probabilidad bajo condiciones de regularidad adecuadas. Las pruebas no paramétricas, por el contrario, no son equivalentes a las pruebas de razón de probabilidad per se no hay probabilidad y sin la metodología unificadora basada en la probabilidad tenemos que obtener resultados de distribución caso por caso. La teoría de la probabilidad empírica.--desarrollado principalmente por Art Owen en Stanford es, sin embargo, un compromiso muy interesante. Ofrece un enfoque basado en la probabilidad de las estadísticas (un punto importante para mí, ya que considero la probabilidad como un objeto más importante que un valor , por ejemplo) sin la necesidad de supuestos de distribución paramétricos típicos. La idea fundamental es un uso inteligente de la distribución multinomial en los datos empíricos, los métodos son muy "paramétricos" pero válidos sin restringir los supuestos paramétricos.pags

Las pruebas basadas en la probabilidad empírica tienen, en mi humilde opinión, las virtudes de las pruebas paramétricas y la generalidad de las pruebas no paramétricas, por lo tanto, entre las pruebas que se me ocurren, se acercan más para calificar para ser paramétricas como no paramétricas, aunque lo haría No use esta terminología.

NRH
fuente
+1 Comentarios muy interesantes. En cuanto a que el límite se vuelve "borroso", lo tomo como una declaración correcta acerca de la percepción, pero no hay borrosidad en las definiciones mismas: la distinción entre paramétrico y no paramétrico es tan clara y nítida como la que existe entre, por ejemplo, finita e infinito
whuber
@whuber, con respecto a lo que está "borroso", me refería específicamente al hecho de que también puede haber supuestos de distribución para las pruebas no paramétricas, por lo que mi segunda definición tampoco funciona. Si intentara una definición nítida, una prueba paramétrica se basa en un modelo que puede ser parametrizado por un subconjunto de un espacio euclidiano de dimensión finita. Lo que creo que es más "borroso" es que, para mí, no está claro qué tan lejos de "no hay supuestos de distribución" puede ir antes de que los supuestos no paramétricos se conviertan en un problema tan importante como los supuestos paramétricos.
NRH
@whuber, ahora leí tu comentario a la pregunta con referencia a Kiefer, y sí, definitivamente es una buena idea consultar a una autoridad para obtener una definición formal. En realidad, estaba más preocupado por lo que la gente generalmente quiere decir cuando dice "no paramétrico", y supongo que pocos tienen en mente una definición de Kiefer.
NRH
Vea mi cita de Kiefer en un comentario a la pregunta original. En particular, "no paramétrico" no significa "sin supuestos de distribución". Por el contrario, las pruebas no paramétricas más conocidos de todos los hacen hipótesis de distribución. Creo que entiendo su sentido de "borroso": elegí la analogía finita / infinita por respeto a eso, porque en la práctica un número muy grande (pero finito) de parámetros podría considerarse infinito.
whuber
2

Paramétrico se usa en (al menos) dos significados: A - Para declarar que está asumiendo la familia de la distribución de ruido hasta sus parámetros. B - Para declarar que está asumiendo la relación funcional específica entre las variables explicativas y el resultado.

Algunos ejemplos:

  • Una regresión cuantil con un enlace lineal calificaría como B-paramétrica y A-no paramétrica.
  • El suavizado de splines de una serie temporal con ruido gaussiano puede calificarse como A-no paramétrico y B-paramétrico.

El término "semi-paramétrico" generalmente se refiere al caso B y significa que no está asumiendo toda la relación funcional, sino que tiene suposiciones más leves como "aditivo en alguna transformación suave de los predictores".

También podría tener suposiciones más suaves sobre la distribución del ruido, como "todos los momentos son finitos", sin especificar específicamente la forma de la distribución. Que yo sepa, no existe un término para este tipo de suposición.

Tenga en cuenta que la respuesta se relaciona con los supuestos subyacentes detrás del proceso de generación de datos. Cuando se dice "prueba paramétrica", uno generalmente se refiere a no paramétrico en sentido A. En esto es lo que quiso decir, entonces respondería "no". Sería imposible ser paramétrico y no paramétrico en el mismo sentido al mismo tiempo.

JohnRos
fuente
Los dos significados en el primer párrafo frecuentemente tienen un tratamiento unificado en la literatura: es decir, no parece haber una distinción fundamental o importante entre ellos. Por cierto, el caso "todos los momentos son finitos" es definitivamente un problema no paramétrico.
whuber
@whuber: la definición en Keifer parece abarcar ambos casos (lo admito, nunca lo leí y todavía estoy buscando excepciones). Por otro lado, los términos cambian sus significados. "Empírico-Bayes" ya no significa para qué lo usó Robbins en 1955. No se puede ignorar el hecho de que circula más de una interpretación.
JohnRos
Bien, pero deberíamos ser un poco selectivos: es obvio que muchas interpretaciones e intentos de definiciones de "paramétrico" y "no paramétrico" son expresiones de ignorancia, no de comprensión. ¿Puede citar una definición alternativa que sea a la vez clara, rigurosa y autorizada (para ser precisos, autoritarios en el sentido de que sería aceptada sin cuestionamientos por una revista revisada por pares creíble)?
whuber
1
@whuber: ¡Acepto el desafío! :-) Aunque tenga en cuenta que, dado que todos los investigadores comienzan sus búsquedas en Wikipedia, es cuestión de tiempo hasta que las revistas revisadas por expertos se alineen con la definición de Wiki. ("si no puedes vencerlos ...")
JohnRos
1
El artículo de Wikipedia cita a Wolfowitz de la década de 1940, quien no solo es el primero en usar "no paramétrico", sino que también es uno de los antepasados ​​intelectuales directos de Kiefer. No creo que encontremos ninguna diferencia real allí. (Kiefer solo agrega un requisito técnico sobre la función de pérdida). Sin embargo, sospecho que muy pocos (si los hay) investigadores genuinos toman Wikipedia como punto de partida, ¡especialmente en campos con fundamentos matemáticos!
whuber
1

Supongo que eso depende de lo que quieren decir con "paramétrico y no paramétrico"? Al mismo tiempo exactamente ambos, o una mezcla de los dos?

Muchos consideran que el modelo de riesgos proporcionales de Cox es semiparamétrico, ya que no calcula de forma paramétrica el riesgo de referencia.

O puede optar por ver muchas estadísticas no paramétricas como realmente paramétricas masivas.

Fomite
fuente
77
Esto parece ser una evasión. La pregunta es indagar si uno aprecia la distinción entre "paramétrico" y "no paramétrico", si es o no claro. Una buena respuesta iluminará esa distinción, no la confundirá.
whuber
1
@whuber ¿Cuál "la pregunta"? ¿El panel o el OP? Porque en mi opinión, el OP no está investigando la distinción de nada. Lo que significa que depende de dónde la gente dibuja la línea. No creo que proporcionar un ejemplo común y filosófico de "Bueno, depende" sea una evasión. Creo que es una respuesta. Por ejemplo, si uno quiere o no considerar que un "paramétrico" sea completamente paramétrico, o simplemente que tenga parámetros
Fomite
El punto sobre "qué pregunta" es bueno. Creo que cuando empiezo a tener problemas con su respuesta es que hace distinciones que según mis recursos no tienen sentido (una "combinación" no tiene sentido, así como la idea de que una "estadística" puede ser paramétrica), lo que sugiere está utilizando una definición diferente de "paramétrico" y "no paramétrico" que yo. Si bien señala que una respuesta tiene que depender de lo que significan estos términos, en realidad no ofrece una definición para que sus comentarios posteriores sean claros o comprensibles.
whuber
@whuber lo suficientemente justo. Encontré que la pregunta original no tenía sentido, así que estaba haciendo lo que podía. La pregunta ahora tiene mejores respuestas que hacen algunas suposiciones sobre lo que significa el OP.
Fomite
0

Bradley, en sus Pruebas estadísticas sin distribución clásicas (1968, p. 15-16 - vea esta pregunta para una cita) aclara la diferencia entre las pruebas sin distribución y las pruebas no paramétricas , que según él a menudo se combinan entre sí, y da un ejemplo de una prueba libre de distribución paramétrica como la prueba de Signos para la mediana. Esta prueba no presupone la distribución subyacente de la población muestreada de valores variables, por lo que no tiene distribución . Sin embargo, si la mediana seleccionada es correcta, los valores superiores e inferiores deben seleccionarse con la misma probabilidad, analizando muestras aleatorias depags=0.5 0.5

Actualizar

(UNA¬UNA)

Abraham
fuente
1
Me gusta el comienzo de esta respuesta porque hace una distinción interesante y la apoya con una buena referencia. Sin embargo, me parece que el resto de la respuesta confunde suposiciones sobre los datos con las propiedades de la estadística de prueba. Los supuestos de la prueba de signos son, de hecho, "libres de distribución". Sin embargo, el hecho de que la distribución de muestreo del estadístico de prueba sea binomial es un tema completamente separado y no hace que el procedimiento sea paramétrico.
whuber
Bueno, Bradley mismo llama a la prueba Sign sin distribución pero paramétrica en la página 15. El cuadro de comentarios es demasiado pequeño para incluir las dos oraciones clave en su totalidad. Lea la otra respuesta, específicamente las oraciones que comienzan "Hablando en términos generales ..." y "Para ser completamente claro ...". Gracias.
Avraham
Si ese es el caso con Bradley, entonces el significado de estos términos ha cambiado desde entonces o (odio decirlo) malinterpretas lo que escribió. (No tengo acceso a una copia que pueda verificar.) Definitivamente no es el caso ahora, ni lo ha sido durante al menos los últimos 30 años, que "paramétrico" se haya referido a la distribución de una estadística de prueba. Vea la cita de Wolfowitz en el artículo de Wikipedia .
whuber
2
FΩθ
2
Por lo que vale, miré otros dos textos estadísticos, Probabilidad y estadística de DeGroot (2ª ed, págs. 520-521) y Introducción de Larson a la teoría de la probabilidad y la inferencia estadística (3ª edición, págs. 508-509) y ambos utilizan el término paramétrico para significar lo que Bradly llama distribución libre , que es como Kiefer, supongo. Entonces, para responder el OP, depende de cómo se defina "paramétrico".
Avraham