La razón por la que pregunto esto es porque parece que los residuos internamente estudiados parecen tener el mismo patrón que los residuos brutos estimados. Sería genial si alguien pudiera ofrecer una
La razón por la que pregunto esto es porque parece que los residuos internamente estudiados parecen tener el mismo patrón que los residuos brutos estimados. Sería genial si alguien pudiera ofrecer una
Un método que me sugirieron es mirar un diagrama de pantalla y verificar el "codo" para determinar la cantidad correcta de PC a usar. Pero si el gráfico no está claro, ¿tiene R un cálculo para determinar el número? fit <- princomp(mydata,
Trataré de describir el problema en cuestión de la manera más general posible. Estoy modelando observaciones como una distribución categórica con un vector de probabilidad de parámetro theta. Entonces, supongo que el vector de parámetros theta sigue una distribución previa de Dirichlet con los...
Supongamos que tiene los registros de un servidor web. En estos registros tienes tuplas de este tipo: user1, timestamp1 user1, timestamp2 user1, timestamp3 user2, timestamp4 user1, timestamp5 ... Estas marcas de tiempo representan, por ejemplo, los clics de los usuarios. Ahora, user1visitará el...
Espero que este se explique por sí mismo, pero avíseme si algo no está claro: ¿hay una versión multivariada de la distribución
Tengo un conjunto de 20 variables que he sometido a análisis factorial en SPSS. Para los fines de la investigación, necesito desarrollar 6 factores. SPSS ha demostrado que 8 variables (de 20) se han cargado con pesos bajos o se han cargado por igual por varios factores, por lo que las eliminé. Las...
Si tenemos dos variables aleatorias independientes X1∼Binom(n,p)X1∼Binom(n,p)X_1 \sim \mathrm{Binom}(n,p) y , ¿cuál es la función de masa de probabilidad de ?X2∼Pois(λ)X2∼Pois(λ)X_2 \sim \mathrm{Pois}(\lambda)X1+X2X1+X2X_1 + X_2 NB Esto no es tarea para
Lee y Lemieux (p. 31, 2009) sugieren al investigador que presente los gráficos mientras realiza el análisis de diseño de regresión discontinua (RDD). Sugieren el siguiente procedimiento: "... para algo de ancho de banda , y para cierto número de bins y a la izquierda y a la derecha del valor de...
Tengo un conjunto de datos donde la intuición empírica dice que debería esperar una estacionalidad semanal (es decir, el comportamiento en sábado y domingo es diferente del resto de la semana). ¿Debería ser cierta esta premisa, no debería un gráfico de autocorrelación darme ráfagas en múltiplos de...
Soy nuevo en el análisis de secuencia, y me preguntaba cómo reaccionaría si los anchos de silueta promedio (ASW) de los análisis de conglomerados de matrices de disimilitud basadas en la coincidencia óptima son bajos (alrededor de 25). ¿Parecería apropiado concluir que hay poca estructura...
Tanto la función logística como la desviación estándar generalmente se denotan como σσ\sigma . Voy a usar σ(x)=1/(1+exp(−x))σ(x)=1/(1+exp(−x))\sigma(x) = 1/(1+\exp(-x)) y sss para la desviación estándar. Tengo una neurona logística con una entrada aleatoria cuya media μμ\mu y desviación estándar...
Tengo algunos datos que necesito visualizar y no estoy seguro de cuál es la mejor manera de hacerlo. Tengo un conjunto de elementos básicos con las frecuencias respectivas y los resultados . Ahora necesito trazar qué tan bien mi método "encuentra" (es decir, un resultado 1) los elementos de baja...
Tengo datos para dos grupos (es decir, muestras) que deseo comparar, pero el tamaño total de la muestra es pequeño (n = 29) y muy desequilibrado (n = 22 vs n = 7). Estos datos son logísticamente difíciles y caros de recopilar, por lo que, aunque 'recopilar más datos' como solución obvia no es útil...
Como soy un ingeniero de software que intenta obtener más estadísticas, tendrás que perdonarme incluso antes de que comience, este es un nuevo territorio serio ... He estado aprendiendo PyMC y trabajando con algunos ejemplos muy (muy) simples. Un problema con el que no puedo trabajar (y no puedo...
Estoy un poco confundido. ¿Alguien puede explicarme cómo calcular la información mutua entre dos términos en base a una matriz de documentos de términos con ocurrencia de términos binarios como ponderaciones? D o c u m e n t 1D o c u m e n t 2D o c u m e n t 3′Wh y′111′Ho w′10 01′Wh e n′111′Wh e r...
Primero, debo decir que he buscado en este sitio la respuesta. No encontré una pregunta que respondiera a mi pregunta o mi nivel de conocimiento es tan bajo que no me di cuenta de que ya leí la respuesta. Estoy estudiando para el Examen de Estadística AP. Tengo que aprender la regresión lineal y...
Tengo un conjunto de elementos que puedo describir de acuerdo con n características. Así:XXXnortenn Xyo: { cyo 1, cyo 2, ... , cyo n} ∣ xyo∈ Xxi:{ci1,ci2,…,cin}∣xi∈Xx_i: \{c_{i1}, c_{i2}, \ldots, c_{in}\} \mid x_i \in X donde es la evaluación (numérica) para el elemento acuerdo con las...
Después de mirar múltiples fuentes en línea, parece que no puedo obtener una respuesta directa. ¿Podría alguien aclararme si los datos ordinales son suficientes para el WSRT y, de no ser así, la prueba de signos es una alternativa adecuada? Finalmente, esto es para mi proyecto de disertación en la...
Encontré este artículo sobre el equipo de minería de datos en la campaña de reelección de Obama. Desafortunadamente, el artículo es muy confuso sobre la maquinaria real de los algoritmos estadísticos. Sin embargo, sonaba como si las técnicas generales fueran conocidas en ciencias sociales y...
A menudo trato con una cantidad razonable de datos de series de tiempo, 50-200 millones de dobles con sellos de tiempo asociados y me gustaría visualizarlos dinámicamente. ¿Existe software para hacer esto de manera efectiva? ¿Qué hay de las bibliotecas y los formatos de datos? Zoom-cache es un...