El problema de mi tarea es dar un contraejemplo en el que una estadística determinada no sea, en general, lo suficientemente mínima. Independientemente de los detalles de encontrar un contraejemplo particular para esta estadística particular, esto me plantea la siguiente pregunta:
Pregunta: ¿Cómo se puede formular la condición de no ser una estadística mínima suficiente de una manera que sea posible demostrar que una estadística suficiente satisface la condición?
Trabajo hasta ahora: La definición de estadística mínima suficiente en mi libro de texto (Keener, Estadísticas teóricas: Temas para un curso básico ) es la siguiente:
- Una estadística es mínimo suficiente si es suficiente y, por cada estadística suficiente existe una función tal que ae .
Tenga en cuenta que (ae ) significa que el conjunto donde falla la igualdad es un conjunto nulo para cada distribución de probabilidad en el modelo estadístico , .
Intentando negar esto, llego a:
- Una estadística no es lo suficientemente mínimo si al menos uno de los siguientes se cumple:
- No es suficiente.
- Existe al menos una estadística suficiente para el que no hay función tal que ae .
Entonces, si una estadística es suficiente, entonces parece que sería extremadamente difícil demostrar que no es lo suficientemente mínima, incluso si no es lo suficientemente mínima. (Porque uno tendría que mostrar 2. en lugar de 1., ya que 1. es falso, pero 2. sería muy difícil de mostrar porque, incluso si uno tiene una estadística de contraejemploen mente, uno todavía tiene que mostrar la inexistencia de cualquier función con esa propiedad. Y la no existencia es a menudo difícil de mostrar).
Mi libro de texto no ofrece condiciones equivalentes (es decir, necesarias y suficientes) para que una estadística sea una estadística mínima suficiente. Ni siquiera da ninguna condición alternativa necesaria para que una estadística sea estadística mínima suficiente (además de ser una estadística suficiente).
Por lo tanto, para mi problema de tarea, si no puedo demostrar que la estadística no es suficiente (porque lo es), ¿cómo podría demostrar que no es lo suficientemente mínima?
fuente
Respuestas:
Como dijiste:
Entonces, por ejemplo, en el caso dondeX1,....,Xn son variables aleatorias independientes de Bernoulli. Podemos probar que(x1,....,xn) no es mínimamente suficiente al demostrar que no es una función de ∑xi . Esto es obvio, ya que la función debe mapearse1 a ambos (1,0,0...,0,0,0) y (0,0,0...,0,0,1) .
fuente
He estado pensando en este problema un poco más recientemente, y esto es lo que se me ocurrió.
DejarΩ ser un espacio de probabilidad, luego una variable aleatoria X es una función medible X:Ω→X , dónde X es un espacio medibleX tiene un designado σ -álgebra, y X es medible con respecto a esto σ -álgebra y el σ -álgebra en Ω ) La distribución deX es solo la medida de retroceso en X es decir PX(A)=PΩ(X−1(A)) . Entonces una estadística deX es cualquier función medible * f:X→Y , dónde Y Es otro espacio arbitrario medible.
Por lo que puedo decir, parece significar que existe una función ** medibleh:Y→Z tal que g=h∘f es decir que g puede ser factorizado a través def .
(En otras palabras, "g debe estar bien definido como una función en f(X)⊆Y ".)
Entonces, ¿cuándo es posible tal factorización? Pensemos en términos de relaciones de equivalencia. Específicamente, defina la relación de equivalencia∼f en X por x1∼fx2⟺f(x1)=f(x2) , asimismo, defina la relación de equivalencia ∼g en X por x1∼gx2⟺g(x1)=g(x2) .
Entonces parag ser factorizable por f , las relaciones de equivalencia ∼f y ∼g deben ser compatibles entre sí, en el sentido de que para cualquier x1,x2∈X , x1∼fx2⟹x1∼gx2 es decir g no puede tomar dos elementos que son equivalentes bajo f y asignarlos a valores que no son equivalentes bajo g es decir "g no puede deshacer la reducción de información realizada previamente por f ".
En otras palabras,g tiene que estar bien definido como una función en X/∼f≅f(X) , es decir, existe tiene que existir una función g~:X/∼f→Z tal que g=g~∘πf , dónde πf es la proyección canónica X→X/∼f . (Para aquellos que se sienten incómodos con la falta de sentido abstracta,πf Es esencial f y g~ Es esencial h . La formulación anterior solo aclara las analogías con otras situaciones).
Por ejemplo, tomeX=Y=Z=R y X una variable aleatoria arbitraria de valor real, entonces g:x↦x2 se puede escribir en función de f:x↦x , pero no al revés, porque x1=x2⟹x21=x22 , pero 12=(−1)2 pero 1≠−1 .
En particular, suponga que cada clase de equivalencia bajo∼f es un singleton (es decir f es inyectiva ). Entoncesg siempre se puede escribir en función de f , ya que X/∼f≅X es decir f(x1)=f(x2)⟹x1=x2 significa que x1=x2⟺f(x1)=f(x2) (en general, para no necesariamente inyectiva f , solo se mantiene una dirección), por lo que nuestra condición se convierte en x1=x2⟹g(x1)=g(x2) , que está trivialmente satisfecho por cualquier g:X→Z . (Definirh , puede hacer lo que quiera en Y∖f(X) siempre que sea medible, y luego para cualquier y∈f(X) , es decir, tal que y=f(x) para algunos x∈X , definir h ser - estar h:y=f(x)↦g(x) . Esto está bien definido cuandof es inyectiva porque hay un único x∈X tal que f(x)=y . En términos más generales, esto solo se define cuando, independientemente de quéx elegimos en f−1(y) , g(x) sigue siendo el mismo valor, es decir f(x1)=f(x2) (=y)⟹g(x1)=g(x2) .)
Además, al observar el Teorema 3.11 en Keener, su declaración es un poco torpe, pero pensando en los términos anteriores, creo que puede reescribirse como:
A partir de esto, queda claro de inmediato que la razón de probabilidad tiene que ser en sí misma mínima suficiente.
Esto también lleva a la conclusión de que:
Por lo tanto, la condición no es tan difícil de mostrar como había pensado.
* Keener no aborda la cuestión de si una estadística debe ser medible o simplemente una función arbitraria o no. Sin embargo, estoy bastante seguro de que una estadística tiene que ser una función medible, porque de lo contrario no podríamos definir una distribución por ella , es decir, una medida de retirada.
**Sih no eran medibles, tendríamos una contradicción porque ambos f y g son medibles y la composición de las funciones medibles es nuevamente medible. Por lo menos,h tiene que ser medible restringido a f(X)⊆Y , aunque creo que esto significaría en la mayoría de los casos razonables que h tendría que estar de acuerdo f(X) con una función que se puede medir en todos Y (tomar h|f(X) en f(X) y por ejemplo z en Y∖f(X) si existe un punto medible z∈Z , tenga en cuenta que ambos f(X) y Y∖f(X) debe ser medible en Y ) así que wlog h se puede suponer que se puede medir en todos Y .
*** Al menos esto es necesario y suficiente para la existencia de una función arbitraria que factoriza a través deg y más f , y creo que ** implica que si existe tal función arbitraria, esta función también debe ser medible, ya que ambas f y g son, es decir, realmente sería una estadística Y→Z .
**** La condición dada es equivalente aT siendo suficiente por el teorema de factorización, 3.6.
fuente