¿Cómo puedo comprobar si la media (p. Ej., La presión arterial) de un subgrupo (p. Ej., Los que murieron) difiere de todo el grupo (p. Ej., Todos los que tuvieron la enfermedad, incluidos los que murieron)?
Claramente, el primero es un subgrupo del segundo.
¿Qué prueba de hipótesis debo usar?
hypothesis-testing
group-differences
usuario1061210
fuente
fuente
Respuestas:
Como señala Michael, al comparar un subgrupo con un grupo general, los investigadores generalmente comparan el subgrupo con el subconjunto del grupo general que no incluye el subgrupo.
Piensa en ello de esta manera.
Si es la proporción que murió, y 1 - p es la proporción que no murió, ypag 1 - p
donde es la media general, ˉ X d es la media de los que murieron, y ˉ X a es la media de los que todavía están vivos. EntoncesX¯. X¯d X¯una
si y solo si cuando
Supongamos que . Por lo tanto ¯ X . ≠ p ¯ X d + ( 1 - p ) ¯ X d = ¯ X d .Xre¯≠ Xuna¯ X.¯≠ p Xre¯+ ( 1 - p ) Xre¯= Xre¯
Supongamos . Por lo tanto, ¯ X d ≠ p ¯ X d + ( 1 - p ) ¯ X a , luego ( 1 - p ) ¯ X d ≠ ( 1 - p ) ¯ X a y desde ( 1 - p ) ≠ 0 , entonces ¯ X d ≠ ¯X.¯≠Xd¯ Xre¯≠ p Xre¯+ ( 1 - p ) Xuna¯ ( 1 - p ) Xre¯≠ ( 1 - p ) Xuna¯ ( 1 - p ) ≠ 0 .Xre¯≠ Xuna¯
Lo mismo puede hacer para las desigualdades.
Por lo tanto, los investigadores generalmente prueban la diferencia entre el subgrupo y el subconjunto del grupo general que no incluye el subgrupo. Esto tiene el efecto de mostrar que el subgrupo difiere del grupo general. También le permite usar métodos convencionales como una prueba t de grupos independientes.
fuente
La forma de probar aquí es comparar a aquellos que tuvieron la enfermedad y murieron con aquellos que tuvieron la enfermedad y no murieron. Puede aplicar la prueba t de dos muestras o la prueba de suma de rango de Wilcoxon si no se puede suponer la normalidad.
fuente
Lo que debe hacer es evaluar las proporciones de la población (tamaño de muestra grande). Las estadísticas que involucran la proporción de la población a menudo tienen un tamaño de muestra que es grande (n => 30), por lo tanto, la distribución de aproximación normal y las estadísticas asociadas se utilizan para determinar una prueba para determinar si la proporción de la muestra (presión arterial de los fallecidos) = proporción de la población (todos quién tenía la enfermedad, incluidos los que murieron).
Es decir, cuando el tamaño de la muestra es mayor o igual a 30, podemos usar las estadísticas del puntaje z para comparar la proporción de la muestra con la proporción de la población usando el valor de la desviación estándar de la muestra p-hat, para estimar la desviación estándar de la muestra, p si no se sabe
La distribución muestral de P (proporción) es aproximadamente normal con un valor medio o esperado, E (P) = p-hat y error estándar, sigma (r) = sqrt (p * q / n).
Las siguientes son las posibles preguntas de hipótesis de prueba que uno puede hacer al comparar dos proporciones:
H0: p-hat = p vs H1: p-hat no es igual a p
H0: p-hat = p vs H1: p-hat> p
H0: p-hat = p vs H1: p-hat <p
Las estadísticas utilizadas para evaluar el tamaño de muestra grande son;
Las estadísticas de prueba están relacionadas con la distribución normal estándar:
Las estadísticas de puntuación z para proporciones
p-hat-p / sqrt (pq / n)
, donde p = proporción estimada, q = 1-p y es la proporción de la población.
La media de la proporción es:
np / n = p-hat = x / n
Desviación Estándar:
= sqrt (npq / n) = sqrt (pq / n)
Reglas de decisión:
Prueba de cola superior (): (H0: P-hat> = P)
Acepte H0 si Z <= Z (1-alfa)
Rechace H0 si Z> Z (1-alfa)
Prueba de cola inferior (Ha: P-hat <= P):
Acepte H0 si Z> = Z (1-alfa)
Rechace H0 si Z
Prueba de dos colas (Ha: P-hat no es igual a P):
Acepte H0 si Z (alfa / 2) <= Z <= Z (1-alfa / 2)
Rechace H0 si Z <Z (alfa / 2) o si Z> Z (1-alfa / 2)
fuente