Estaba pensando en el significado de familia a escala de ubicación. Entiendo que para cada miembro de una familia de escala de ubicación con parámetros ubicación y una escala , entonces la distribución de no depende de ningún parámetro y es igual para cada pertenece a esa familia.a b Z = ( X - a ) / b X
Entonces, mi pregunta es ¿podría proporcionar un ejemplo donde dos al azar de la misma familia de distribución están estandarizados pero eso no da como resultado una variable aleatoria con la misma distribución?
Digamos que e provienen de la misma familia de distribución (donde con familia quiero decir, por ejemplo, tanto Normal como Gamma, etc.). Definir:Y
sabemos que tanto como tienen la misma expectativa y varianza, .Z 2 μ Z = 0 , σ 2 Z = 1
¿Pero pueden tener diferentes momentos superiores?
Mi intento de responder a esta pregunta es que si la distribución de e depende de más de 2 parámetros de lo que podría ser. Y estoy pensando en el generalizado que tiene 3 parámetros.Y t - s t u d e n t
Pero si el número de parámetros es y e provienen de la misma familia de distribución con la misma expectativa y varianza, ¿significa que y tienen la misma distribución (momentos más altos)?X Y Z 1 Z 2
Respuestas:
Aparentemente existe cierta confusión en cuanto a qué es una familia de distribuciones y cómo contar los parámetros libres versus los parámetros libres más fijos (asignados). Esas preguntas son un aparte que no está relacionado con la intención del OP y de esta respuesta. No uso la palabra familia aquí porque es confusa. Por ejemplo, una familia según una fuente es el resultado de variar el parámetro de forma. @whuber afirma que una "parametrización" de una familia es un mapa continuo desde un subconjunto de ℝ , con su topología habitual, en el espacio de distribuciones, cuya imagen es esa familia.n Usaré la forma de la palabra que cubre tanto el uso previsto de la palabra x 2 -2x+4 a 2 x 2 + a 1 x+ a 0 a 1 =0 a 2 =0identificación y conteo familiar y de parámetros . Por ejemplo, la fórmulatiene la forma de una fórmula cuadrática, es decir,y sila fórmula sigue siendo de forma cuadrática. Sin embargo, cuandola fórmula es lineal y la forma ya no es lo suficientemente completa como para contener un término de forma cuadrática. Se alienta a quienes deseen usar la palabra familia en un contexto estadístico adecuado a contribuir a esa pregunta por separado .x2−2x+4 a2x2+a1x+a0 a1=0 a2=0
Respondamos a la pregunta "¿Pueden tener diferentes momentos superiores?". Hay muchos ejemplos de este tipo. Notamos de paso que la pregunta parece ser sobre PDF simétricos, que son los que tienden a tener ubicación y escala en el caso simple de dos parámetros. La lógica: suponga que hay dos funciones de densidad con formas diferentes que tienen dos parámetros idénticos (ubicación, escala). Luego hay un parámetro de forma que ajusta la forma o las funciones de densidad no tienen un parámetro de forma común y, por lo tanto, son funciones de densidad de forma no común.
Aquí, hay un ejemplo de cómo el parámetro de forma figura en él. La función de densidad de error generalizada y aquí , es una respuesta que parece tener una curtosis libremente seleccionable.
Por Skbkekas - Trabajo propio, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=6057753
El PDF (también conocido como función de densidad "probabilidad", tenga en cuenta que la palabra "probabilidad" es superflua) esβ2αΓ(1β)e−(|x−μ|α)β
La media y la ubicación son , la escala es y es la forma. Tenga en cuenta que es más fácil presentar archivos PDF simétricos, porque esos archivos PDF a menudo tienen ubicación y escala como los dos casos de parámetros más simples, mientras que los PDF asimétricos, como el PDF gamma , tienden a tener forma y escala como sus parámetros de caso más simples. Continuando con la función de densidad de error, la varianza es , la asimetría es y la curtosis esμ α β α 2 Γ ( 3α2Γ(3β)Γ(1β) 0 Γ(5β)Γ(1β)Γ(3β)2−3 . Por lo tanto, si establecemos la varianza en 1, entonces asignamos el valor de desde mientras se varía , de modo que la curtosis se puede seleccionar en el rango de a .α α2=Γ(1β)Γ(3β) β>0 −0.601114 ∞
Es decir, si queremos variar los momentos de orden superior, y si queremos mantener una media de cero y una varianza de 1, debemos variar la forma. Esto implica tres parámetros, que en general son 1) la media o la medida apropiada de ubicación, 2) la escala para ajustar la varianza u otra medida de variabilidad, y 3) la forma. TOMA al menos TRES PARÁMETROS PARA HACERLO.
Tenga en cuenta que si hacemos las sustituciones , en el PDF anterior, obtenemosβ=2 α=2–√σ e−(x−μ)22σ22π−−√σ,
que es la función de densidad de una distribución normal. Por lo tanto, la función de densidad de error generalizada es una generalización de la función de densidad de la distribución normal. Hay muchas formas de generalizar la función de densidad de una distribución normal. Otro ejemplo, pero con la función de densidad de la distribución normal solo como un valor límite, y no con valores de sustitución de rango medio como la función de densidad de error generalizada, es la función de densidad de Student . Usando la función de densidad de Student , tendríamos una selección de curtosis bastante más restringida, y es el parámetro de forma porque el segundo momento no existe para . Por otra parte, df−t −t df≥2 df<2 ≥ 1 - t df → ∞en realidad no está limitado a valores enteros positivos, en general es real . El Student solo se normaliza en el límite como , por lo que no lo elegí como ejemplo. No es un buen ejemplo ni un contraejemplo, y en esto no estoy de acuerdo con @ Xi'an y @whuber.≥1 −t df→∞
Déjame explicarte esto más a fondo. Se pueden elegir dos de muchas funciones de densidad arbitrarias de dos parámetros para tener, por ejemplo, una media de cero y una varianza de uno. Sin embargo, no todos serán de la misma forma. Sin embargo, la pregunta se relaciona con las funciones de densidad de la MISMA forma, no con formas diferentes. Se ha afirmado que las funciones de densidad que tienen la misma forma es una asignación arbitraria, ya que es una cuestión de definición, y en eso mi opinión difiere. No estoy de acuerdo en que esto sea arbitrario porque uno puede hacer una sustitución para convertir una función de densidad en otra, o no se puede. En el primer caso, las funciones de densidad son similares, y si por sustitución podemos mostrar que las funciones de densidad no son equivalentes, entonces esas funciones de densidad son de forma diferente.
Por lo tanto, utilizando el ejemplo del PDF de Student , las opciones son considerarlo como una generalización de un PDF normal, en cuyo caso un PDF normal tiene una forma permitida para un PDF de Student , o no, en cuyo caso, el PDF del estudiante tiene una forma diferente del PDF normal y, por lo tanto, es irrelevante para la pregunta planteada .−t −t −t
Podemos argumentar esto de muchas maneras. Mi opinión es que un PDF normal es una forma sub-seleccionada del PDF de Student , pero que un PDF normal no es una sub-selección de un PDF gamma a pesar de que puede mostrarse un valor límite de un PDF gamma ser un PDF normal, y, mi razón para esto es que en el caso normal / Student ' , el soporte es el mismo, pero en el caso normal / gamma el soporte es infinito versus semi-infinito, que es la incompatibilidad requerida .−t −t
fuente
Si desea un ejemplo que sea una "familia de distribución parametrizada oficialmente nombrada, puede consultar la distribución gamma generalizada, https://en.wikipedia.org/wiki/Generalized_gamma_distribution . Esta familia de distribución tiene tres parámetros, por lo que puede fijar la media y varianza y todavía tienen libertad para variar momentos superiores. Desde la página wiki, el álgebra no parece atractivo, preferiría hacerlo numéricamente. Para aplicaciones estadísticas, busque gamlss en este sitio, que es una extensión de gam (aditivo generalizado modelos, en sí mismos una generalización de glm's) que tienen parámetros para "ubicación, escala y forma".
Otro ejemplo son las distribuciones , extendidas para ser una familia de escala de ubicación. Luego, el tercer parámetro serán los grados de libertad, que desconfiarán de la forma para una ubicación y escala fijas.t
fuente
fuente
Creo que se está preguntando si dos variables aleatorias que provienen de la misma familia de escala de ubicación pueden tener la misma media y varianza, pero al menos un momento superior diferente. La respuesta es no.
fuente
Como la pregunta se puede interpretar de varias formas, dividiré esta respuesta en dos partes.
El problema con el caso A puede ser respondido / demostrado fácilmente por muchas familias con un parámetro de forma.
R: ¿Pueden dos distribuciones diferentes de la misma familia de distribución de 2 parámetros tener la misma media y varianza?
La respuesta es sí y ya se puede mostrar usando uno de los ejemplos mencionados explícitamente: la distribución Gamma normalizada
Familia de distribuciones gamma normalizadas.
B: ¿Pueden dos distribuciones diferentes de la misma familia de distribución de escala de ubicación de 2 parámetros tener la misma media y varianza?
Creo que la respuesta es no si consideramos solo familias suaves (suave: un pequeño cambio en los parámetros dará como resultado un pequeño cambio en la distribución / función / curva). Pero esa respuesta no es tan trivial y cuando usaríamos familias más generales (no uniformes), podemos decir que sí , aunque estas familias solo existen en teoría y no tienen relevancia práctica.
Generar una familia de escala de ubicación a partir de una única distribución por traducción y escalado
Para una familia de escala de ubicación que se puede generar de esta manera, tenemos:
¿Se pueden generar distribuciones de miembros para las dos familias de escala de ubicación de parámetros a partir de una distribución de miembro único mediante traducción y escalado?
Para familias particulares de dos parámetros de escala de ubicación, como la familia de distribuciones normales, no es demasiado difícil demostrar que se pueden generar de acuerdo con el proceso anterior (escalado y traducción de un solo miembro de ejemplo).
Uno puede preguntarse si es posible que cada familia de escala de ubicación de dos parámetros se genere a partir de un solo miembro mediante traducción y escalado. O una declaración en conflicto: "¿Puede una familia de dos parámetros de escala de ubicación contener dos distribuciones de miembros diferentes con la misma media y varianza?", Para lo cual sería necesario que la familia sea una unión de múltiples subfamilias que se generan por traducción y escalada.
Caso 1: Familia de distribuciones t de estudiantes generalizadas, parametrizadas por dos variables
Usemos la distribución t de Student generalizada (tres parámetros):
entonces nosotros tenemos
que puede considerarse una familia de escala de ubicación de dos parámetros (aunque no muy útil) que no puede generarse mediante la traducción y el escalado de un solo miembro.
Caso 2: familias de escala de ubicación generadas por escalado negativo de una distribución única con sesgo distinto de cero
Familias lisas
fuente