Conceptualmente, entiendo el significado de la frase "el área total debajo de un PDF es 1". Debe significar que las posibilidades de que el resultado esté en el intervalo total de posibilidades es del 100%.
Pero realmente no puedo entenderlo desde un punto de vista "geométrico". Si, por ejemplo, en un PDF el eje x representa la longitud, ¿el área total debajo de la curva no aumentaría si x se midiera en mm en lugar de km?
Siempre trato de imaginar cómo se vería el área debajo de la curva si la función se aplanara en línea recta. ¿La altura (posición en el eje y) de esa línea sería la misma para cualquier PDF, o tendría un valor contingente en el intervalo en el eje x para el que se define la función?
probability
pdf
integral
TheChymera
fuente
fuente
Respuestas:
La función de densidad de probabilidad se mide en porcentajes por unidad de medida de su eje x. Digamos que en un punto dado su PDF es igual a 1000. Esto significa que la probabilidad de es donde está en metros. Si cambia las unidades a centímetros, la probabilidad no debería cambiar para el mismo intervalo, pero el mismo intervalo tiene 100 centímetros más que metros, por lo que y resolver obtenemos . Hay 100 veces menos unidades de probabilidad (porcentajes) por centímetro que por metro.X0 0 X0 0< x < x0 0+ dX 1000reX reX 1000rex = PD F′( x′0 0) ⋅ 100reX′ PAGD F′( x′0 0) = PD F( x0 0)100
fuente
Podría ayudarlo a darse cuenta de que el eje vertical se mide como una densidad de probabilidad . Entonces, si el eje horizontal se mide en km, entonces el eje vertical se mide como una densidad de probabilidad "por km". Supongamos que dibujamos un elemento rectangular en dicha cuadrícula, que tiene 5 "km" de ancho y 0.1 "por km" de alto (que tal vez prefiera escribir como "km "). El área de este rectángulo es de 5 km x 0.1 km = 0.5. Las unidades se cancelan y nos queda solo una probabilidad de la mitad.- 1- 1 - 1
Si cambia las unidades horizontales a "metros", tendría que cambiar las unidades verticales a "por metro". El rectángulo ahora tendría 5000 metros de ancho y tendría una densidad (altura) de 0,0001 por metro. Aún te queda una probabilidad de la mitad. Es posible que se preocupe por lo extraño que se verán estos dos gráficos en la página en comparación entre sí (¿no tiene que ser mucho más ancho y más corto que el otro?), Pero cuando está dibujando físicamente las tramas, puede usar lo que sea escala que te gusta. Mire a continuación para ver qué poca rareza necesita estar involucrada.
Puede resultarle útil considerar los histogramas antes de pasar a las curvas de densidad de probabilidad. En muchos sentidos son análogos. El eje vertical de un histograma es la densidad de frecuencia [por unidad ]X y las áreas representan frecuencias, nuevamente porque las unidades horizontales y verticales se cancelan al multiplicarse. La curva PDF es una especie de versión continua de un histograma, con una frecuencia total igual a uno.
Una analogía aún más cercana es un histograma de frecuencia relativa : decimos que dicho histograma se ha "normalizado", de modo que los elementos de área ahora representan proporciones de su conjunto de datos original en lugar de frecuencias sin procesar, y el área total de todas las barras es una. Las alturas son ahora densidades de frecuencia relativas [por unidad ]X . Si un histograma de frecuencia relativa tiene una barra que corre a lo largo deX valores de 20 km a 25 km (por lo que el ancho de la barra es de 5 km) y tiene una densidad de frecuencia relativa de 0.1 por km, entonces esa barra contiene una proporción de 0.5 de los datos. Esto corresponde exactamente a la idea de que un elemento elegido al azar de su conjunto de datos tiene un 50% de probabilidad de estar en esa barra. El argumento anterior sobre el efecto de los cambios en las unidades todavía se aplica: compare las proporciones de datos que se encuentran en la barra de 20 km a 25 km con la de la barra de 20,000 metros a 25,000 metros para estas dos parcelas. También puede confirmar aritméticamente que las áreas de todas las barras suman uno en ambos casos.
¿Qué podría haber querido decir con mi afirmación de que el PDF es una "especie de versión continua de un histograma"? Tomemos una pequeña franja bajo una curva de densidad de probabilidad, a lo largo de los valores de en el intervalo , de modo que la franja sea ancho, y la altura de la curva sea aproximadamente . Podemos dibujar una barra de esa altura, cuya área representa la probabilidad aproximada de estar en esa tira.[ x , x + δ x ] δ x f ( x ) f ( x )X [ x , x + δx ] δX F( x ) F( x )δX
¿Cómo podríamos encontrar el área bajo la curva entre y ? Podríamos subdividir ese intervalo en pequeñas tiras y tomar la suma de las áreas de las barras, , que correspondería a la probabilidad aproximada de estar en el intervalo . Vemos que la curva y las barras no se alinean con precisión, por lo que hay un error en nuestra aproximación. Al hacer cada vez más pequeño para cada barra, llenamos el intervalo con barras más y más estrechas, cuya proporciona una mejor estimación del área.x = b ∑ f ( x )x = a x = b [ a , b ] δ x ∑ f ( x )∑ f( x )δX [ a , b ] δX ∑ f( x )δX
Para calcular el área con precisión, en lugar de suponer que era constante en cada tira, evaluamos la integral , y esto corresponde a la verdadera probabilidad de estar en el intervalo . La integración sobre toda la curva da un área total (es decir, probabilidad total), por la misma razón que sumar las áreas de todas las barras de un histograma de frecuencia relativa da un área total (es decir, la proporción total) de uno. La integración es en sí misma una especie de versión continua de tomar una suma.∫ b a f ( x ) d x [ a , b ]F( x ) ∫siunF( x ) dX [ a , b ]
Código R para parcelas
fuente
Ya obtuvo dos respuestas, con una excelente de Silverfish , sin embargo, creo que una ilustración podría ser útil aquí ya que usted preguntó sobre geometría e "imaginando" esas funciones.
Comencemos con un ejemplo simple de distribución de Bernoulli :
Dado que los valores son discretos, no hay una "curva" sino solo dos puntos, sin embargo, la idea es similar: si desea conocer la probabilidad total (área debajo de la curva) debe sumar las probabilidades de ambos posibles resultados:
0.010 0.028 0.094 0.198 0.260 0.400 0.404 0.292 0.166 0.092 0.044 0.010 0.002
También preguntaste sobre la distribución "plana" (uniforme) :
fuente
La siguiente idea clave se mencionó en un comentario, pero no en una respuesta existente ...
Una forma de intuir acerca de las propiedades de un PDF es considerar que el PDF y el CDF están relacionados por integración (cálculo), y que el CDF tiene una salida monotónica que representa un valor de probabilidad entre 0 y 1.
El área total integrada sin unidades debajo de la curva PDF no se ve afectada por las unidades del eje X.
Para hacerlo mas simple...
Si el eje X se hace más grande, numéricamente, debido a un cambio en las unidades, entonces el eje Y debe reducirse en un factor lineal correspondiente .
fuente