Comprobando si una densidad es familia exponencial

8

Tratando de demostrar que esto no pertenece a una familia exponencial.

f(y|a)=4(y+a)(1+4a);0<y<1,a>0

Aquí está mi enfoque:

f(y|a)=4(y+a)elog(1+4a)
f(y|a)=(4y)(1+ay)elog(1+4a)

Comparándolo con la forma estándar, h(y)=4y y g(a) que tiene que ser una función de solo a, no se puede definir en términos de a solo como y en el 1+ayEs inseparable. ¿Es esto suficiente para mostrar que esta distribución no pertenece a una familia exponencial?

Por favor revise mi enfoque.

usuario30438
fuente

Respuestas:

7

Has puesto el dedo en el quid de la cuestión y, de hecho, el resultado es bastante obvio, pero la lógica parece un poco extraña. El método descrito a continuación utiliza repetidamente logaritmos y diferenciación para simplificar progresivamente el problema, hasta que se vuelve completamente trivial.


Por definición, f es el PDF para una familia exponencial cuando su logaritmo se puede escribir como una suma de algo en términos del parámetro (a) solo, algo más en términos de datos (y) solamente, y algo más que es producto de una función de a y una función de y. Esto significa que puede ignorar cualquier factor que claramente dependa solo del parámetro o solo de los datos. En este caso es obvio41+4a depende solo de a, entonces podemos ignorarlo.

El problema es con y+a. Necesitamos demostrar que no pueden existir funciones "agradables"η y T tal que log(y+a)=η(a)T(y) más alguna función de a solo más alguna otra función de ysolo. Esa parte "más" es molesta, pero podemos acabar con ella diferenciando primero con respecto aa (la derivada de cualquier función de y solo será cero) y luego con respecto a y (la derivada de una función de asolo será cero). Al negar ambos lados (para que el lado izquierdo sea positivo) esto da

2aylog(y+a)=1(a+y)2=η(a)T(y).

Quiero tomar logaritmos para simplificar el lado derecho (que, siendo igual al lado izquierdo, siempre es positivo). Asumiendoη y T ambos son continuos garantizarán que haya algunos intervalos de valores para a y para y en el cual η(a)>0 y T(y)>0 si no η(a)>0 y T(y)>0. Esto significa que de hecho podemos dividir el lado derecho en dos factores positivos, permitiendo que se aplique el logaritmo. Hacerlo produce

2log(a+y)=log1(a+y)2=log(η(a)T(y))=log(η(a))+log(T(y))

(o de lo contrario, una expresión comparable con algunos signos menos). Ahora jugamos el mismo juego: en cualquier caso, diferenciando ambos lados con respecto a ambosa y y rendimientos

2(a+y)2=0,

Una imposibilidad.

Mirando hacia atrás, este enfoque tuvo que asumir ambos η y Ttener segundas derivadas dentro de algunos intervalos de sus argumentos. El análisis se puede hacer en la misma línea usando diferencias finitas para debilitar esos supuestos, pero probablemente no valga la pena.

whuber
fuente
Mi notación es la de Wikipedia, que también enumera un conjunto de reglas para identificar familias exponenciales. . Los métodos ilustrados aquí pueden usarse para justificar esas reglas.
whuber
2
Hermoso análisis; El uso de segundas derivadas parciales mixtas recuerda de alguna manera los criterios para verificar si las funciones son "nomogramables", al menos de formas particulares (que también implican una separación similar).
Glen_b -Reinstalar Monica
Gracias @Glen_b. También es más que una reminiscencia del análisis de interacciones en tablas de dos vías. Esa es la versión de diferencias finitas. ;-)
whuber
Si; eso también es una conexión que he explotado al jugar con nomogramas.
Glen_b -Reinstalar Monica
@whuber Gracias por tu explicación. Pero me resulta difícil entender por qué estamos tomando derivados parciales y volviendo a registrar. ¿Existe la posibilidad de que esto se resuelva definiendo una función de indicador para y que siempre dependa de a.
user30438
1

Estará en una familia exponencial si se puede escribir en fh(x)eηT(x)A(η)(Con otras condiciones).


Dejar g(x,η)=ηT(x)A(η). Ahora para 4 puntos de datosx1,x2,x3,x4 en el espacio muestral (g(x1,η)g(x2,η))(g(x3,η)g(x4,η))= (T(x1)T(x2))(T(x3)T(x4)) , que está libre de η.

Ahora aqui f(y;a)=4y+a(4a+1) = 4e(ln(y+a)ln(4a+1)). Tomarg(x,η)=ln(y+a)ln(4a+1).


Entonces (g(x1,η)g(x2,η))(g(x3,η)g(x4,η))=(ln(y1+a)ln(y2+a))(ln(y3+a)ln(y4+a)) - que no está libre de a. entoncesf(y;a) no pertenece a la familia exponencial.

Mriganka Aulia
fuente
+1 Me gusta el enfoque directo. Indica claramente cómo se pueden utilizar las diferencias finitas para aislar el comportamiento clave deF.
whuber