¿Alguien sabe un método para comparar dos variables con una prueba de chi cuadrado si las variables son de diferentes encuestas con diferentes svydesign()
declaraciones? Estoy buscando probar una diferencia en una distribución variable en dos ondas de una encuesta, pero la svychisq()
declaración se limita a un objeto de diseño.
¿Es legítimo apilar las dos variables en una nueva data.frame
, crear una nueva svydesign
declaración con los pesos colectivos y luego ejecutar la prueba?
r
chi-squared
survey
david rae
fuente
fuente
Respuestas:
Si va por el camino de apilar los conjuntos de datos, debe definir los superestratos correspondientes a los dos conjuntos de datos / ondas, de modo que
svydesign()
sepa que son independientes. Por lo tanto, su nuevosvydesign
tendrá estratos = cruz del año y estratos, las PSU de los diseños originales y los pesos de los diseños originales.Como sugerí en el comentario, en la literatura se han propuesto otras formas de combinar estimaciones y pruebas. Wu (2004) usa la probabilidad empírica basada en variables comunes entre los dos conjuntos de datos.
Para variables continuas, idealmente, desearía utilizar la prueba de Kolmogorov-Smirnov con datos "planos", pero no sé si sus extensiones funcionan para datos de encuestas; Lo dudo. Por lo tanto, es posible que deba convertir sus variables continuas a ordinales en say[Iniciar sesión2( n ) ] grupos de percentiles o bins de igual ancho del rango variable (donde la función anterior del tamaño de la muestra es un número de bins comúnmente usado para un histograma), y aplique el Rao-Scott a ellos.χ2
fuente