Confusión sobre cuándo usar las estadísticas

15

Me refería a esta video conferencia para calcular el intervalo de confianza . Sin embargo, tengo algo de confusión. Este tipo está usando estadísticas para el cálculo. Sin embargo, creo que debería haber sido una estadística t . No se nos da la verdadera desviación estándar de la población. Estamos utilizando la desviación estándar de la muestra para estimar la verdadera.zt

Entonces, ¿por qué tomó la distribución normal para el intervalo de confianza en lugar de ?t

usuario34790
fuente
Sólo como referencia, que se resuelve el problema expuesto en el vídeo con una t estadística daría: n <- 36; diff <- 12; sd <- 40; 2 * (pt(diff/(sd/sqrt(n)), df = n - 1) - 0.5) = 0.9195145.
Antoni Parellada

Respuestas:

10

Tienes razón, debería ser una distribución t. Pero como el tamaño de la muestra es 36 (es decir,> 20), la distribución az también sería apropiada. Recuerde, a medida que crece el tamaño de la muestra, la distribución t se vuelve más similar a la distribución z en forma.

Piel gris
fuente
21

Cuando tomé mi primer curso de estadística (después de los dinosaurios, pero cuando las computadoras reales todavía ocupaban una habitación entera), nos enseñaron a usar la tabla z si había más de 30 grados de libertad, en parte porque la tabla t del libro solo subió a 30 grados de libertad y si mira la tabla t verá que en algún lugar alrededor de 28 grados de libertad obtendrá los mismos resultados que la tabla z a 2 dígitos significativos (y al hacer todo eso a mano tendimos redondear más a menudo). Quizás el presentador todavía sea de esa escuela.

Tiene razón en que si está usando la desviación estándar de la muestra para una prueba en la medida en que realmente debería usar la distribución t independientemente del tamaño (que es mucho más fácil de hacer en estos días) y solo usará la z (normal estándar) cuando conozca la desviación estándar de la población, pero a efectos prácticos, a menudo no verá una diferencia significativa si el tamaño de la muestra es grande.

Greg Snow
fuente
1
Gran anécdota :)
swiecki 01 de
Un efecto secundario desafortunado del hecho de que a veces está bien usar intervalos z es que algunos textos introductorios presentan intervalos z en lugar de intervalos t. Hay muchas áreas de la ciencia donde las muestras son rutinariamente lo suficientemente pequeñas como para que los intervalos z sean totalmente inapropiados. Les cuento esto a mis alumnos todos los años, con instrucciones explícitas, pero todavía un número considerable de ellos usan intervalos z :-(
Michael Lew - reinstalan a Mónica el
4

Me está costando mucho averiguar si Khan simplificó las cosas en el video o si simplemente está equivocado. Tendría que decir lo último, pero el problema no está en la pregunta z o t . Llama a lo que calcula un intervalo de confianza y luego dice que está 92% seguro de que la media de la población se encuentra dentro del rango dado. Eso simplemente no es algo que concluyas de un intervalo de confianza ... desafortunadamente.

Entonces vuelvo a la pregunta t vs. z y empiezo a preguntarme si cometió un error allí. Estoy pensando que quizás no porque él diga que si la muestra es más pequeña, debe hacer una corrección. Entonces los otros respondedores probablemente estén en lo correcto. Solo está usando z porque ya lo introdujo y está lo suficientemente cerca con el n de 36. No planeo revisar todos los videos, pero imagino que introducirá la distribución t más tarde, con suerte el próximo.

Es realmente desafortunado que Khan Academy esté equivocado en tantas áreas de estadísticas ... pero tal vez me siento así porque solo me apuntan a videos con problemas.

John
fuente