¿Cómo se lee la notación ?

10

¿Cómo se lee la notación ? ¿Es sigue una distribución normal? ¿O es una distribución normal? O tal vez es aproximadamente normal ...XXN(μ,σ2)X X X

¿Qué pasa si hay varias variables que siguen (o las palabras que sean) la misma distribución? Como se escribe

no
fuente
XN(μ,σ) debe serXN(μ,σ2)
mandato
77
@mandata que (desafortunadamente) depende de a quién le preguntes. Muchos autores usan tanto en definición como en notación. σ
ekvall
Prefiero yo mismo, pero va contra la corriente. σ
mandata
3
La notación común es que " " significa distribuido como, " " (tenga en cuenta el punto) significa aproximadamente distribuido como. ˙ ˙
Cliff AB
¿Es la notación correcta con respecto al segundo punto? (X,Y)N(μ,σ2)
no el

Respuestas:

7

Supongo que la variable X se distribuye de acuerdo con la distribución Normal con el vector medio y la desviación estándar .σμσ

Vladislavs Dovgalecs
fuente
¿Por qué vector ? μ
no el
Porque la distribución normal puede ser multivariada. Puede ser de valor único, también se puede generalizar a dimensiones. n
Vladislavs Dovgalecs
3
¿Por qué la solo un escalar? σ
no el
Tienes razón, la no es escalar en general para el caso multivariante. Estás hablando sobre la matriz de covarianzaΣσΣ
Vladislavs Dovgalecs
estándar desviación .
conjugateprior
9

En cuanto al uso de los símbolos ("sigue", "se distribuye de acuerdo con") y ("es aproximadamente"), vea esta respuesta . Así es como se usan los símbolos al menos en Estadísticas / Econometría.

Con respecto a las convenciones de notación para una distribución, lo normal es un caso límite : generalmente escribimos los parámetros definitorios de una distribución junto con su símbolo, los parámetros que le permitirán a uno escribir correctamente su función de distribución acumulativa y su función de densidad de probabilidad / masa. No tomamos nota de los momentos, que generalmente son una función de estos parámetros, pero no son iguales.

Entonces, para un uniforme que varía en , escribimos . La media de la distribución es mientras que la varianza es . Para una gamma (parametrización de escala de forma), escribimos . La media es y la varianza . Etc.U ( a , b ) ( a + b ) / 2 ( b - a )[a,b]U(a,b)(a+b)/2G ( k , θ ) k θ k θ 2(ba)2/12G(k,θ)kθkθ2

En el caso de la distribución normal, el parámetro también es la media de la distribución, mientras que el parámetro es la raíz cuadrada de la varianza. Tengo la impresión (posiblemente errónea) de que en los círculos de Ingeniería uno ve más a menudo (que se ajusta a la regla general de notación), mientras que en los círculos Econometría casi siempre se ve (que cae en la tentación de proporcionar los momentos, tratando a como el parámetro base y no como el cuadrado del mismo).σ N ( μ , σ ) N ( μ , σ 2 ) σ 2μσN(μ,σ)N(μ,σ2)σ2

Alecos Papadopoulos
fuente
6

EDITAR: Mi respuesta anterior no pudo responder la pregunta real. Lo que sigue es mi intento de una respuesta más directa.


¿Cómo se lee la notación ?XN(μ,σ2)

Otras respuestas ya le dicen lo que significa la notación, a saber, que es una variable aleatoria normalmente distribuida con alguna media y varianza . La respuesta de Dilip también da una buena explicación de qué otras posibles interpretaciones hay cuando la notación es menos clara que , por ejemplo, para los parámetros generales , viz. .μ σ 2 σ 2 { a , b } X N ( a , b )Xμσ2σ2{a,b}XN(a,b)

Cada vez que veo esta notación en el texto, tiendo a leerla para que tenga sentido gramaticalmente. Yo diría que esta es la forma sensata de tratar la notación. Por lo tanto, la respuesta a su pregunta es que, sabiendo qué significa matemáticamente la notación, simplemente la lee de cualquier manera que se ajuste al texto. Aquí hay dos ejemplos:

(1) Sea ...XN(a,b)

(2) Considere tres variables aleatorias independientes,XN(0,1),YN(1,2),ZExp(λ).

En (1) lo leí como (p. Ej.) "Sea normalmente distribuido con media ay varianza b ...", y en (2) lo leo como "... es normal normal ...".XXX

¿Es X sigue una distribución normal?

Sí, eso también funciona. Mucha gente lo dice de esta manera, aunque es posible que desee incluir la media y la varianza que caracteriza la distribución.

¿O X es una distribución normal?

No, eso es incorrecto. Vea esta vieja respuesta mía para una cuenta de lo que es una distribución.

O tal vez X es aproximadamente normal ...

No, eso también es incorrecto. Hay otras formas de denotar esto. Como se señaló en los comentarios, es uno de ellos.

¿Qué pasa si hay varias variables que siguen (o las palabras que sean) la misma distribución? Como se escribe

Si todos son independientes, una manera fácil de escribir esto es , dado que tiene variables (iid significa independiente e idénticamente distribuido). Si no son independientes, puede decir que son posiblemente dependientes, pero (marginalmente) están idénticamente distribuidos como . O puede que tenga que declarar su distribución conjunta, eso depende del propósito que tenga para considerar las variables aleatorias.n X i , i = 1 , 2 , ... , n N ( μ , σ 2 )XiiidN(μ,σ2),i=1,2,nnXi,i=1,2,,nN(μ,σ2)

Si son conjuntamente normales, es fácil escribir que para caracterizar completamente su distribución conjunta usando algún vector medio y matriz de covarianza .μ ΣX:=(X1,,Xn)N(μ,Σ)μΣ

En general, es posible definir cualquier función de distribución multivariante y luego escribir que .XFFXF

ekvall
fuente
¿No es bueno que, independientemente de la convención utilizada, sea ​​siempre la variable aleatoria normal estándar? N(0,1)
Dilip Sarwate
@DilipSarwate, de hecho! Hace que el nombre "estándar" también sea muy adecuado.
ekvall
5

La dificultad no está en saber qué significa . Incluso N ( 3 , 5 2 ) es razonablemente inequívoco para la mayoría de las personas, ya que significa una variable aleatoria normal con media 3 y varianza 5 2 o varianza (los puristas deberían creer que la desviación estándar es un parámetro más fundamental de lo que la varianza debería decir "desviación estándar " en su lugar). Sin embargo, qué se entiende por , por ejemplo,N(μ,σ2)N(3,52)3525 N ( a , b ) N ( 3 , 25 )255N(a,b)N(3,25)está sujeto a al menos tres convenciones diferentes con respecto a la varianza o desviación estándar. Las tres convenciones coinciden en que es la media de pero tiene diferentes significados para diferentes personas.3 X 2 5μXX25

  • XN(,25) significa que la desviación estándar de es . 25X25

  • XN(,25) significa que la varianza de es .25X25

  • XN(,25) significa que la varianza de esX .125

Vea esta pregunta y los comentarios que siguen para algunos detalles.

Dilip Sarwate
fuente
¿Quién además de usted tuvo la interpretación de que el segundo parámetro de un Normal es el inverso de la varianza? Esta es la primera vez que recuerdo haber visto algo así.
Mark L. Stone
@ MarkL.Stone Por favor, no eches aspersiones sobre mi veracidad. Si se hubiera molestado en seguir el enlace que he incluido en mi respuesta y haber leído los comentarios, habría visto que el Moderador whuber dijo "Otros, especialmente en un contexto bayesiano, incluso parametrizan las normales por su precisión, como en ". y el cardenal moderador dijo que "también existen los parámetros naturales de lo normal , que probablemente parezcan poco naturales para la mayoría". Estos "parámetros naturales" surgen cuando la distribución normal se define como un miembro de la familia exponencial de distribuciones. N(μ,1/σ2)
Dilip Sarwate
No estaba tratando de arrojar aspersiones sobre tu veracidad. Miré el hilo y vi tu respuesta, pero me perdí el comentario de Whuber. Supongo que no soy bayesiano.
Mark L. Stone
4

es una variable aleatoria " X ";XX

se lee "se distribuye como";

se lee "Normal";N

se lee "con media μ " (la convención es que la primera entrada después del paréntesis abierto es la media, y la segunda es la varianza o la desviación estándar, dependiendo de la notación, ver más abajo); yμμ

se lee "con la varianza σ 2 (o la desviación estándar σ 2 , dependiendo del uso del autor / usuario. En este caso, supongo que es con la varianza σ 2 .σ2σ2σ2σ2

En conjunto, tiene una variable aleatoria que se distribuye como Normal con una media "mu" ( μ ) y una varianza "sigma al cuadrado" ( σ 2 ).Xμσ2

También puede decir que sigue una normalidad. . .X

Si varias variables siguen la misma distribución, puede representar esto de varias maneras, pero es posible que desee indexar las variables de a n . Entonces podrías escribir, X iN ( μ , σ 2 ) , para i = 1 a n .i=1nXiN(μ,σ2)i=1n

EstadísticasEstudiante
fuente
0

se distribuye normalmente con media μ y desviación estándar σ . La tilde no significa aproximación, ya que no está relacionada con un signo igual, aunque lo implica de alguna manera ya que X nunca se conoce definitivamente.Xμσ

mandata
fuente
Por qué no? Hay poblaciones que son completamente conocidas.
no el
representa una variable, no un conjunto de valores. X
mandata
2
X es de hecho una variable aleatoria y x podría ser uno de sus valores. Pero eso significa que no hay aproximación: todo lo que hay que saber (definitivamente) sobre X se afirma en la expresión que estamos discutiendo.
conjugateprior
2
Para el registro, es una tilde. Tilda es una marca de arroz basmati :-)
conjugateprior