En la página de Wikipedia sobre clasificadores ingenuos de Bayes , hay esta línea:
(Una distribución de probabilidad sobre 1 está bien. Es el área bajo la curva de campana que es igual a 1.)
¿Cómo puede un valor estar bien? Pensé que todos los valores de probabilidad se expresaban en el rango . Además, dado que es posible tener dicho valor, ¿cómo se obtiene ese valor en el ejemplo que se muestra en la página?
distributions
probability
normal-distribution
pdf
lector de babelproof
fuente
fuente
p
para la densidad de probabilidad y mayúsculasP
para la probabilidadRespuestas:
Esa página Wiki está abusando del lenguaje al referirse a este número como una probabilidad. Tienes razón en que no lo es. En realidad es una probabilidad por pie . Específicamente, el valor de 1.5789 (para una altura de 6 pies) implica que la probabilidad de una altura entre, por ejemplo, 5.99 y 6.01 pies está cerca del siguiente valor sin unidades:
Este valor no debe exceder 1, como sabes. (El pequeño rango de alturas (0.02 en este ejemplo) es una parte crucial del aparato de probabilidad. Es el "diferencial" de altura, que abreviaré .) Las probabilidades por unidad de algo son llamadas densidades por analogía a otras densidades, como masa por unidad de volumen.d(height)
Las densidades de probabilidad de buena fe pueden tener valores arbitrariamente grandes, incluso infinitos.
Este ejemplo muestra la función de densidad de probabilidad para una distribución Gamma (con parámetro de forma de y escala de ). Debido a que la mayor parte de la densidad es menor que , la curva tiene que elevarse por encima de para tener un área total de como se requiere para todas las distribuciones de probabilidad.3/2 1/5 1 1 1
Esta densidad (para una distribución beta con parámetros ) se vuelve infinita en y en . ¡El área total todavía es finita (e igual a )!1/2,1/10 0 1 1
El valor de 1.5789 / pie se obtiene en ese ejemplo al estimar que las alturas de los machos tienen una distribución normal con una media de 5.855 pies y una varianza de 3.50e-2 pies cuadrados. (Esto se puede encontrar en una tabla anterior). La raíz cuadrada de esa varianza es la desviación estándar, 0.18717 pies. Re-expresamos 6 pies como el número de SD de la media:
La división por la desviación estándar produce una relación.
La densidad de probabilidad normal, por definición, es igual a
(En realidad, hice trampa: simplemente le pedí a Excel que calculara NORMDIST (6, 5.855, 0.18717, FALSE). Pero realmente lo comparé con la fórmula, solo para asegurarme). Cuando eliminamos el diferencial esencial de la fórmula solo queda el número , como la sonrisa del gato de Cheshire. Nosotros, los lectores, debemos entender que el número tiene que multiplicarse por una pequeña diferencia en las alturas para producir una probabilidad.d(height) 1.5789
fuente
Este es un error común al no entender la diferencia entre las funciones de masa de probabilidad, donde la variable es discreta, y las funciones de densidad de probabilidad, donde la variable es continua. Vea Qué es una distribución de probabilidad :
fuente
Creo que una distribución uniforme continua en un intervalo proporciona un ejemplo directo para esta pregunta: en una distribución uniforme continua, la densidad en cada punto es la misma en cada punto (distribución uniforme). Además, debido a que el área debajo del rectángulo debe ser uno (así como el área debajo de la curva normal debe ser uno) ese valor de densidad debe ser porque cualquier rectángulo con base y área debe tener una altura .[a,b] 1/(b−a) b−a 1 1/(b−a)
Entonces, el valor para la densidad uniforme en el intervalo es , en el intervalo es , ...[0,0.5] 1/(0.5−0)=2 [0,0.1] 10
fuente
No sé si el artículo de Wikipedia se ha editado después de las publicaciones iniciales en este hilo, pero ahora dice "Tenga en cuenta que un valor mayor que 1 está bien aquí; es una densidad de probabilidad en lugar de una probabilidad, porque la altura es una variable continua. ", y al menos en este contexto inmediato, P se usa para probabilidad y p se usa para densidad de probabilidad. Sí, muy descuidado ya que el artículo usa p en algunos lugares para significar probabilidad, y en otros lugares como densidad de probabilidad.
Volver a la pregunta original "¿Puede un valor de distribución de probabilidad superior a 1 estar bien?" No, pero lo he visto hecho (ver mi último párrafo a continuación).
Aquí le mostramos cómo interpretar una probabilidad> 1. En primer lugar, tenga en cuenta que las personas pueden dar un esfuerzo del 150% y lo hacen, ya que a menudo escuchamos en deportes y, a veces, trabajamos https://www.youtube.com/watch?v=br_vSdAOHQQ . Si está seguro de que algo sucederá, esa es una probabilidad de 1. Una probabilidad de 1.5 podría interpretarse ya que está 150% seguro de que el evento sucederá, algo así como dar un esfuerzo del 150%.
Y si puede tener una probabilidad> 1, supongo que puede tener una probabilidad <0. Las probabilidades negativas se pueden interpretar de la siguiente manera. Una probabilidad de 0.001 significa que casi no hay posibilidad de que ocurra el evento. Probabilidad = 0 significa "de ninguna manera". Una probabilidad negativa, como -1.2, corresponde a "Tienes que estar bromeando".
Cuando era un niño recién salido de la escuela hace 3 décadas, fui testigo de un evento más sorprendente que romper la barrera del sonido en la aviación, es decir, romper la barrera de la unidad en la probabilidad. Un analista con un doctorado. en Física había pasado 2 años a tiempo completo (probablemente dando el 150%) desarrollando un modelo para calcular la probabilidad de detectar el objeto X, al final del cual su modelo y análisis completaron con éxito la revisión por pares de varios científicos e ingenieros estrechamente afiliados a los EE. UU. gobierno. No le diré qué es el objeto X, pero el objeto X, y la probabilidad de detectarlo, fue y sigue siendo de considerable interés para el gobierno de EE. UU. El modelo incluía una fórmula para = Prob (el evento y sucede).Py Py y algunos otros términos, todos combinados en la fórmula final, que fue Prob (se detecta el objeto X). De hecho, los valores calculados de Prob (se detecta el objeto X) estaban dentro del rango de [0,1], como es "tradicional" en probabilidad en la tradición de Kolmogorov. en su forma original siempre estaba en [0,1] e involucraba funciones trascendentales de "variedad de jardín" que estaban disponibles en Fortran estándar o en cualquier calculadora científica. Sin embargo, por una razón conocida solo pero para el analista y Dios (tal vez porque lo había visto hecho en sus clases y libros de Física, pero no sabía que le mostraron los pocos casos en los que funciona, no los muchos más en los que funciona). no, y el nombre de este tipo y el juicio científico / matemático no fueron los de Dirac),Py Py (e ignore el término restante), que en adelante se denominará . Fue esta expansión de Taylor de dos términos de que se insertó en la expresión final para Prob (se detecta el objeto X). Lo que no se dio cuenta, hasta que se lo señalé, era que era igual a aproximadamente 1.2 usando sus valores de caso base para todos los parámetros. De hecho, fue posible paraPy Py Py Py subir a aproximadamente 1.8. Y así es como la barrera de la unidad se rompió en probabilidad. Pero el tipo no sabía que había logrado esta hazaña pionera hasta que se lo señalé, después de haber realizado cálculos rápidos en una calculadora científica Casio de tamaño de tarjeta de crédito con batería en una sala de conferencias oscura (no podría haberlo hecho con una calculadora con energía solar). Sería como si Chuck Yeager saliera a dar una vuelta el domingo en su avión, y solo unos meses después se le informara que había roto la barrera del sonido.
fuente
Cuando la variable aleatoria es continua y su función de densidad de probabilidad es , es una probabilidad, pero no es una probabilidad y puede ser mayor que uno. La informada no es una probabilidad, pero es.X f(x) f(x)dx f(x) f(height|male) f(height|male)dheight
En otras palabras, para una variable aleatoria continua , , , y . Lo mismo ocurre con las probabilidades condicionales.X P(X∈[x,x+dx))=f(x)dx P(X∈[a,b])=∫baf(x)dx P(X=x)=P(X∈[x,x])=0
fuente
El valor de punto en un valor de parámetro particular de una gráfica de densidad de probabilidad sería una probabilidad, ¿verdad? Si es así, entonces la declaración podría corregirse simplemente cambiando P (altura | hombre) a L (altura | hombre).
fuente