Encuesta diseño chi cuadrado

¿Alguien sabe un método para comparar dos variables con una prueba de chi cuadrado si las variables son de diferentes encuestas con diferentes svydesign()declaraciones? Estoy buscando probar una diferencia en una distribución variable en dos ondas de una encuesta, pero la svychisq()declaración se limita a un objeto de diseño.

¿Es legítimo apilar las dos variables en una nueva data.frame, crear una nueva svydesigndeclaración con los pesos colectivos y luego ejecutar la prueba?

r chi-squared survey david rae
fuente

Esto debería migrarse al sitio web CrossValidated stats.SE. Esperaré a que se migre, pero empezaré a leer esto mientras tanto: citeulike.org/user/ctacmo/article/8898414

StasK

@StasK ¿algún enlace sin un muro de pago?

Anthony Damico

@AnthonyDamico, pregunte a la Sociedad Estadística de Canadá: - \. También puede estar en la página de Wu.

StasK

¿Qué quieres decir con "comparar"? ¿Son estas variables continuas, variables ordinales, variables nominales? No hay suficiente en su pregunta para ser respondido adecuadamente.

StasK

@StasK, gracias por la ayuda, para ser claros, esta comparación es para variables ordinales y continuas

david rae

Respuestas:

Si va por el camino de apilar los conjuntos de datos, debe definir los superestratos correspondientes a los dos conjuntos de datos / ondas, de modo que svydesign()sepa que son independientes. Por lo tanto, su nuevo svydesigntendrá estratos = cruz del año y estratos, las PSU de los diseños originales y los pesos de los diseños originales.

Como sugerí en el comentario, en la literatura se han propuesto otras formas de combinar estimaciones y pruebas. Wu (2004) usa la probabilidad empírica basada en variables comunes entre los dos conjuntos de datos.

Para variables continuas, idealmente, desearía utilizar la prueba de Kolmogorov-Smirnov con datos "planos", pero no sé si sus extensiones funcionan para datos de encuestas; Lo dudo. Por lo tanto, es posible que deba convertir sus variables continuas a ordinales en say $[\log_2(n)]$ grupos de percentiles o bins de igual ancho del rango variable (donde la función anterior del tamaño de la muestra es un número de bins comúnmente usado para un histograma), y aplique el Rao-Scott a ellos. $\chi^2$

StasK
fuente