Estoy obteniendo un número debajo de cero al calcular dos desviaciones estándar de la media. ¿Esta bien?

8

No soy un mago de las matemáticas, así que por favor mantenga su respuesta lo suficientemente simple. Necesito completar un examen de detección de estadísticas para un curso de métodos más tarde hoy, y estoy colgado sobre un tema que surgió durante el examen de práctica. El conjunto de datos que obtuve se refería a la cantidad de homicidios ocurridos en varias ciudades. El rango de estos datos es 0-5. Cuando estoy compilando intervalos de confianza y calculando hasta dos desviaciones estándar de la media, obtengo valores bajos que son negativos. Obviamente no puedes tener un número negativo de homicidios. Al calcular los intervalos de confianza a dos desviaciones estándar de la media, ¿debería presentar el valor bajo en CERO o debería presentar el número negativo? Por ejemplo, si un IC del 95% causó que el cálculo fuera de -1.5 a 3, ¿presentaría eso o presentaría 0 a 3? Gracias.

Almiar
fuente
2
Este problema es común cuando se trata de números positivos. Que yo sepa, ambos son aceptados dependiendo del punto de vista. Sin embargo, lo que la gente suele hacer es construir un intervalo de confianza para el logaritmo del parámetro (R) y luego exponga el intervalo de confianza.
ocram
Gracias por la ayuda. Los registros no son parte del material de prueba de práctica, por lo que voy a suponer que no esperarán eso de mí en este momento. Quizás será cubierto durante el curso en sí.
Rick
66
¿La pregunta requiere que calcules dos desviaciones estándar de los datos de la media de los datos ? ¿O requiere que le des un intervalo de confianza para la media ? Aunque el intervalo de confianza para la media implica desviaciones estándar, estos son dos cálculos muy diferentes. El segundo tiene más sentido para un examen estadístico para mí, y es mucho menos probable que vaya por debajo de cero. Si necesita calcular el intervalo de confianza para la media, deberá calcular el error estándar de la media y usarlo en lugar de la desviación estándar de la población.
Stephan Kolassa
2
Gran punto @StephanKolassa. ¿Por qué estaríamos interesados ​​en dos desviaciones estándar de la media en una distribución como esta que es poco probable que sea normal (que es poco probable que sea simétrica)? Pero una estimación de los homicidios medios, y más o menos dos desviaciones estándar de la estimación de la media, sería de interés ya que la estimación de la media se distribuye más o menos normalmente (a medida que el tamaño de la muestra aumenta) bajo el teorema del límite central.
Peter Ellis
@StephanKolassa - Sugiero que combine sus 2 comentarios en un campo de respuesta.
rolando2

Respuestas:

1

Me parece poco probable que la pregunta requiera que calcule dos desviaciones estándar de los datos de la media , especialmente dado que es poco probable que sus datos sean incluso simétricos, mucho menos distribuidos normalmente (ya que son discretos). No veo ninguna pregunta interesante que realmente pueda responderse con este cálculo.

Parece más probable que se le pida que proporcione un intervalo de confianza para la media . Esto también implica calcular las desviaciones estándar de los datos, pero luego se calcula el error estándar de la media a partir de esta desviación estándar dividiendo por el cuadrado del tamaño de la muestra y finalmente construyendo el intervalo de confianza basado en el error estándar. Por lo tanto, es mucho menos probable que este intervalo de confianza vaya por debajo de cero (y si lo hiciera, debería truncar en cero). Tenga en cuenta que la distribución muestral de la media se distribuirá más o menos normalmente a medida que aumenta el tamaño de la muestra, por lo que este intervalo realmente responde una pregunta interesante, es decir, dónde esperamos que se encuentre la media real.

Stephan Kolassa
fuente
Un consejo para @PeterEllis, cuyo comentario sobre la respuesta original incluí descaradamente en esta respuesta.
Stephan Kolassa