¿Cómo debo interpretar las gráficas de altura de densidad?
Por ejemplo, en la gráfica anterior, el pico es de aproximadamente 0.07 en x = 18. ¿Puedo inferir que alrededor del 7% de los valores son alrededor de 18? ¿Puedo ser más específico que eso? También hay un segundo pico en x = 30 con una altura de 0.02. ¿Eso significaría que alrededor del 2% de los valores son alrededor de 30?
Editar: La pregunta sobre ¿Puede un valor de distribución de probabilidad superior a 1 estar bien?analiza el valor de probabilidad de> 1, que no es un problema aquí en absoluto. También discute eso en relación con el ingenuo clasificador de Bayes, que tampoco es el punto aquí. Quiero tener, en un lenguaje simple, las inferencias numéricas que podemos extraer de tales curvas de densidad. Se discute el papel del área bajo la curva, pero mi pregunta es específicamente qué inferencia podemos hacer con respecto a una combinación particular de x e y que existe en la curva. Por ejemplo, ¿cómo podemos relacionar x = 30 e y = 0.02 en este gráfico? ¿Qué afirmación podemos escribir con respecto a la relación entre 30 y 0.02 aquí? Dado que las densidades son para un valor unitario, ¿podemos decir que el 2% de los valores ocurren entre 29.5 y 30.5? Si ese es el caso, ¿cómo interpretamos si los valores varían de solo 0 a 1, como en la siguiente gráfica:
Si el 100% de los valores ocurren entre 0 y 1, ¿por qué hay una curva fuera de 0 y 1?
Aquí hay una parte plana en x = 0.1 a x = 0.2 donde y es igual a 0.8. Forma un rectángulo. ¿Cómo podemos averiguar qué proporción de valores ocurren entre x = 0.1 yx = 0.2
(PD: Si encuentra esta pregunta interesante / importante, por favor, vote a favor;)
fuente
Respuestas:
Debe tener cuidado con su redacción aquí. Suponiendo que x es una variable continua, la probabilidad de cualquier valor individual es precisamente cero. Hablar, como lo hizo, sobre la probabilidad de que un valor se encuentre en algún punto está bien, aunque es posible que desee ser un poco más preciso. Su segunda declaración, en la que proporcionó el intervalo junto con la probabilidad, es algo que estaría buscando.
En esencia, una función integral de densidad con respecto a x le informará sobre la probabilidad en sí misma (por eso se llama densidad ). Obviamente, el intervalo durante el cual se integrará puede ser arbitrariamente pequeño, por lo que puede acercarse a un punto en un grado arbitrario. Dicho esto, cuando la función de densidad varía muy lentamente durante ese intervalo, puede aproximar la integral mediante alguna técnica numérica, como la regla trapezoidal .
Para resumir: la altura de la función de densidad es solo eso, su altura. Cualquier cosa que desee concluir sobre la probabilidad tendrá que incluir la integración de una forma u otra.
fuente