¿Por qué no puedo calcular 1.5 desviaciones estándar usando matemáticas básicas?

8

El problema de distribución normal.

No entiendo por qué no puedo simplemente agregar 1.5 desviaciones estándar para obtener la respuesta.

Si 1 desviación estándar es 10 kg y la media es 400 kg, entonces 415 kg es 1,5 desviaciones estándar.

Entonces lo calculé así: .3413 + ((.4772-.3413)/2) = 0.40925

Esta ecuación toma la mitad de la diferencia entre dos desviaciones estándar y una desviación estándar, luego la agrega a la primera desviación estándar.

¿Por qué esto no funciona? ¿Por qué tengo que usar la tabla provista?

Ben
fuente
55
¿De dónde sacaste los números 0.3413, 0.4772 y 0.3413? En cualquier caso, la razón por la que no puede simplemente agregar 1.5 SD es porque le pidieron el área debajo de la curva, para lo cual debe usar la tabla normal que le brinda dichas áreas.
mb7744
3
@Ben El problema indica que la desviación estándar es 10. A menos que quiera decir que calculó algún valor que corresponde a 1 desviación estándar, y calculó otro valor que corresponde a 2 desviaciones estándar. Pero si es así, eso es lo que preguntaba mb7744.
Jelsema
1
@jelsema sí, el lado derecho de 1 desviación estándar comprende el 34.13% de los resultados. La segunda desviación estándar comprende el 47.72% de los resultados. Debido a que son solo 1.5 desviaciones estándar, tomamos la diferencia entre la primera desviación estándar y la segunda desviación estándar y obtenemos la mitad, ya que son solo 1.5 desviaciones estándar.
Ben
8
@Ben, estás interpolando linealmente. Eso no es válido, con lo que quiero decir que no es exactamente correcto, porque el área debajo de la curva (digamos de la media) no es una función lineal del número de desviaciones estándar; si lo fuera, entonces la cifra de 2 desviaciones estándar de 0.4772 sería el doble de la cifra de 1 desviación estándar de 0.3413, que no lo es.
Mark L. Stone
1
Quiero saber 5 al cuadrado. Entonces, ¿por qué no puedo simplemente tomar 10 al cuadrado (que es 100) y dividirlo por la mitad?
user253751

Respuestas:

20

La razón por la que no podemos interpolar (linealmente) entre 0.3413 y 0.4772 es porque el pdf de la distribución Normal no es uniforme (plano en un solo valor).

Considere este ejemplo más simple, donde podemos usar geometría para encontrar las áreas.

ingrese la descripción de la imagen aquí

El área total de la trama es 1(es un corte cuadrado en diagonal, con las dos piezas reorganizadas para ser un triángulo). Usando Base*Height/2podemos encontrar que el área de la región A es 0.5, y el área total de las regiones B y C también lo es 0.5.

Pero las áreas de B y C no son iguales. El área de la región C es 0.5*0.5/2 = 0.125y, por lo tanto, el área de la región B es 0.375. Entonces, aunque las regiones B y C son igualmente anchas a lo largo del eje x, dado que la altura no es constante, tienen áreas diferentes.

La distribución normal con la que está tratando en su ejercicio es similar, pero con una función más complicada para la altura en lugar de un triángulo simple. Debido a esto, el área entre dos valores no se puede resolver de manera simple, de ahí el uso de puntajes Z y una tabla para encontrar probabilidades.

Jelsema
fuente
1
¿Puedo usar la interpolación lineal para adivinar la respuesta de opción múltiple? ¿Ya que están tan separados? ¿Es una mala idea?
Ben
2
@Ben Eso es generalmente una gran idea. Las pruebas de opción múltiple se crean para este tipo de manipulación. Poder estimar el tamaño de una respuesta es una habilidad muy útil a lo largo de la vida. Sin embargo, también es bueno que pregunte y comprenda este problema porque a medida que avance, habrá más y más preguntas como esta que no tienen una fórmula para responder.
rhaskett
66
@rhaskett, aunque la presencia de la respuesta "ninguno de los anteriores" estropea esa estrategia.
David Z
@Ben Una vez que es hora de la prueba, por supuesto, usa cualquier método que puedas para obtener la respuesta correcta. Sin embargo, un problema con las pruebas de opción múltiple es que permiten adivinar y verificar estrategias para evitar la necesidad de resolver un valor. A la larga, a menos que esta sea su clase de matemática terminal, depender de esa estrategia lo perjudicará más de lo que ayuda.
Dean MacGregor
@DavidZ True. Perdí esa opción.
rhaskett
6

Solo para proporcionar una ilustración diferente sobre el mismo tema ...

En su cálculo inicial, trataría la curva normal como una distribución uniforme, en cuyo caso su enfoque inicial sería el cálculo matemático correcto para el rectángulo de doble trama en el gráfico a continuación (con diferentes valores reales), simplemente porque estaría capaz de expresar el área como una dependencia lineal simple de la distancia del eje :x

A1.5SD=A2SDA1SD2=heightX2SDX1SD2

Pero desea calcular el área sombreada diagonalmente debajo de la curva de la distribución gaussiana, que como se indicó anteriormente no mantendría una relación lineal con la distancia a lo largo del eje incluso si la distribución fuera triangular:x

7 7

Antoni Parellada
fuente
2

La fórmula para la distribución gaussiana es:

ecuación de gauss

Donde sigma = desviación estándar y mu = media

(robado de wikipedia)

Cuando pregunta por el área, está integrando esta función en el rango especificado. Esta integral no tiene una solución de "forma cerrada": no hay forma de encontrar una expresión usando funciones matemáticas "normales" como factorial, multiplicación, exponenciación, raíces, etc., que sea igual a esa integral.

Es como logaritmos o funciones trigonométricas: no puede producir una ecuación de forma cerrada para ellos usando otras funciones algebraicas (puede usar series infinitas, pero eso no es "cerrado"). Por lo tanto, utiliza una tabla (si se siente retro, o una calculadora, que simplemente utiliza una tabla detrás de escena incrustada en su procesador como punto de partida) cuando necesita calcularla realmente.

De hecho, el paralelo con los logaritmos es bastante adecuado: también se puede definir un logaritmo por una integral, es decir, ln (x) = integral de (1 / x) de 0 a x.

Neologismo inteligente
fuente
0

Geométricamente, .4772 - .3413representa el área debajo del gráfico entre 1 desviación estándar y 2 desviaciones estándar. Si divide esta región a la mitad horizontalmente, la parte a la izquierda de la división será el área entre 1 y 1.5 desviaciones estándar, como desee. Bien hasta ahora.

Sin embargo, cuando tomas (.4772 - .3413) / 2, obtienes la mitad del área , pero no necesariamente lo que estabas buscando, que es, sin embargo, mucha área estaba a la mitad horizontalmente. Con este gráfico, esa parte izquierda de la división no es la mitad del área : la línea se inclina hacia abajo (va desde la parte superior izquierda a la parte inferior derecha), por lo que hay más espacio en la parte izquierda que en la parte derecha. Si este gráfico fuera una línea horizontal recta, entonces el área que estaba dividiendo sería un rectángulo, y la mitad del área realmente estaría a la mitad.

rakslice
fuente