¿Hay una distribución en forma de meseta?

30

Estoy buscando una distribución donde la densidad de probabilidad disminuya rápidamente después de un punto alejado de la media, o en mis propias palabras, una "distribución en forma de meseta".

Algo entre el gaussiano y el uniforme.

dontloo
fuente
8
Podría sumar un RV gaussiano y un RV uniforme.
StrongBad
3
A veces se escucha sobre las llamadas distribuciones platykurtic .
JM no es un estadístico

Respuestas:

53

Es posible que esté buscando una distribución conocida bajo los nombres de distribución generalizada normal (versión 1) , Subbotin o distribución de potencia exponencial. Está parametrizado por ubicación , escala y forma con pdfσ βμσβ

β2σΓ(1/ /β)exp[-(El |X-μEl |σ)β]

Como puede observar, para se parece y converge a la distribución de Laplace, con converge a la normalidad y cuando a la distribución uniforme.β = 2 β = β=1β=2β=

ingrese la descripción de la imagen aquí

Si está buscando un software que lo tenga implementado, puede verificar la normalpbiblioteca para R (Mineo y Ruggieri, 2005). Lo bueno de este paquete es que, entre otras cosas, implementa la regresión con errores generalizados de distribución normal, es decir, minimiza la norma .Lpags


Mineo, AM y Ruggieri, M. (2005). Una herramienta de software para la distribución de potencia exponencial: el paquete normalp. Revista de software estadístico, 12 (4), 1-24.

Tim
fuente
20

El comentario de @ StrongBad es una muy buena sugerencia. La suma de un RV uniforme y un RV gaussiano puede darle exactamente lo que está buscando si elige los parámetros correctamente. Y en realidad tiene una solución de forma cerrada razonablemente agradable.

El pdf de esta variable viene dado por la expresión:

14 4una[mirF(X+unaσ2)-mirF(X-unaσ2)]

es el "radio" de la RV uniforme de media cero. σ es la desviación estándar de la RV gaussiana de media cero.unaσ

Archivos PDF

Steve Cox
fuente
3
Referencia: Bhattacharjee, GP, Pandit, SNN y Mohan, R. 1963. Cadenas dimensionales que involucran distribuciones de error rectangulares y normales. Technometrics, 5, 404–406.
Tim
15

Hay un número infinito de distribuciones "en forma de meseta".

¿Buscabas algo más específico que "entre el gaussiano y el uniforme"? Eso es algo vago.

Aquí hay una fácil: siempre puedes pegar un medio normal en cada extremo de un uniforme:

Densidad con centro uniforme y colas gaussianas

Puede controlar el "ancho" del uniforme en relación con la escala de lo normal para que pueda tener mesetas más anchas o más estrechas, dando una clase completa de distribuciones, que incluyen el gaussiano y el uniforme como casos limitantes.

La densidad es:

h2πσmi-12σ2(X-μ+w/ /2)2yoXμ-w/ /2+h2πσyoμ-w/ /2<Xμ+w/ /2+h2πσmi-12σ2(X-μ-w/ /2)2yoX>μ+w/ /2

h=11+w/(2πσ)

σ0w(μw/2,μ+w/2)w0σN(μ,σ2)

μ=0 0

Trama de varios ejemplos de este uniforme de cola gaussiana

Quizás podríamos llamar a esta densidad un "uniforme de cola gaussiana".

Glen_b -Reinstate a Monica
fuente
1
Ach! ¡Me encanta asistir a bailes formales con un uniforme de cola gausiana! ;)
Alexis
7

Vea mi distribución "Torre del Diablo" aquí [1]:

F(X)=0.3334El |XEl |<0,9399
F(X)=0.2945/ /X20,9399El |XEl |<2.3242
F(X)=0 02.3242El |XEl |

Función de densidad de la torre del diablo con parte superior plana, lados convexos, cortada en extremos

La distribución "slip-dress" es aún más interesante.

Es fácil construir distribuciones que tengan la forma que desee.

[1]: Westfall, PH (2014)
"Kurtosis as Peakedness, 1905 - 2014. RIP" Enm
. Stat. 68 (3): 191–195. doi: 10.1080 / 00031305.2014.917055
pdf de acceso público: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf

Peter Westfall
fuente
Hola Peter: me tomé la libertad de asignar la función e insertar una imagen, así como dar una referencia completa. (Si la memoria sirve, creo que Kendall y Stuart dan los detalles de una desacreditación similar en su texto clásico. Si no recuerdo mal, ha pasado mucho tiempo, creo que también discuten que no se trata de una cola pesada)
Glen_b
Gracias Glen_b. Nunca dije que la curtosis midiera lo que miden los números del índice de cola. Más bien, mi artículo demuestra que la curtosis es, para una clase muy amplia de distribuciones, casi igual a E (Z ^ 4 * I (| Z |> 1)). Por lo tanto, la curtosis claramente no le dice nada sobre el 'pico', que generalmente se encuentra en el rango {Z: | Z | <1}. Más bien, está determinado principalmente por las colas. Llámelo E (Z ^ 4 * I (| Z |> 1)) si el término "colas pesadas" tiene otro significado.
Peter Westfall
Además, @Glen_b ¿a qué índice de cola te refieres? Hay infinitamente muchos. Los cruces de cola no definen la "cola" correctamente. De acuerdo con algunas definiciones de pesadez de cola, N (0,1) es más "cola pesada" que .9999 * U (-1,1) + .0001 * U (-1000,1000), aunque este último es obviamente más de cola pesada, a pesar de tener colas finitas. Y, por cierto, este último tiene curtosis extremadamente alta, a diferencia de N (0,1).
Peter Westfall
No puedo encontrarme diciendo "índice de cola" en ninguna parte de mi comentario; No estoy muy seguro de a qué te refieres cuando dices "a qué índice de cola te refieres". Si te refieres a lo de la cola pesada, lo mejor que puedes hacer es comprobar lo que Kendall y Stuart realmente dicen; Creo que en realidad comparan la relación asintótica de densidades para variables simétricas estandarizadas, pero quizás podrían haber sido funciones de supervivencia; el punto era de ellos, no mío
Glen_b
Extraño. Bueno, en cualquier caso, Kendall y Stuart se equivocaron. La curtosis es obviamente una medida del peso de la cola, como lo demuestran mis teoremas.
Peter Westfall
5

F(X)

F(X)=k11+X2unapara XR

dónde:

  • una
  • kk=unaπpecado(π2una)

una

ingrese la descripción de la imagen aquí

.

una

ingrese la descripción de la imagen aquí

lobos
fuente
3

Otro ( EDITAR : lo simplifiqué ahora. EDITAR2 : lo simplifiqué aún más, aunque ahora la imagen realmente no refleja esta ecuación exacta):

F(X)=13αIniciar sesión(aporrear(αuna)+aporrear(αX)aporrear(αsi)+aporrear(αX))

Iniciar sesión(aporrear(X))X

unalpagshunauna=2si=1


Aquí hay un código de muestra en R:

f = function(x, a, b, alpha){
  y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
  y = y/pi/alpha/6
  return(y)
}

fEs nuestra distribución. Vamos a trazarlo para una secuencia dex

plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)

for(i in 1:10){
  y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
  lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)

Salida de consola:

#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"

Y trama:

Mi distribución basada en log cosh

Podría cambiar ay b, aproximadamente, el inicio y el final de la pendiente, respectivamente, pero luego se necesitaría una mayor normalización, y no lo calculé (es por eso que estoy usando a = 2y b = 1en la trama).

Firebug
fuente
2

Si está buscando algo muy simple, con una meseta central y los lados de una distribución triangular, puede combinar, por ejemplo, N distribuciones triangulares, N dependiendo de la relación deseada entre la meseta y el descenso. Por qué triángulos, porque sus funciones de muestreo ya existen en la mayoría de los idiomas. Usted ordena al azar de uno de ellos.

En R eso daría:

library(triangle)
rplateau = function(n=1){
  replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)

ingrese la descripción de la imagen aquí ingrese la descripción de la imagen aquí

agenis
fuente
2

Aquí hay una bonita: el producto de dos funciones logísticas.

(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))

Esto tiene el beneficio de no ser por partes.

B ajusta el ancho y A ajusta la inclinación de la caída. A continuación se muestran B = 1: 6 con A = 2. Nota: No me he tomado el tiempo para descubrir cómo normalizar esto correctamente.

Distribución meseta

Adjwilley
fuente