Preguntas etiquetadas con hypothesis-testing

12
Prueba exacta de Fisher con pesas?

¿Alguien sabe de una variación de la prueba exacta de Fisher que tenga en cuenta los pesos? Por ejemplo, muestreo de pesos . Entonces, en lugar de la tabla cruzada 2x2 habitual, cada punto de datos tiene un valor de "masa" o "tamaño" que pesa el punto. Datos de ejemplo: A B weight N N 1 N N 3 Y...

12
¿Cómo realizar la imputación de valores en una gran cantidad de puntos de datos?

Tengo un conjunto de datos muy grande y faltan alrededor del 5% de valores aleatorios. Estas variables están correlacionadas entre sí. El siguiente conjunto de datos R de ejemplo es solo un ejemplo de juguete con datos correlacionados ficticios. set.seed(123) # matrix of X variable xmat <-...

12
¿Se pueden calcular los valores p para la prueba de correlación de Pearson solo a partir del coeficiente de correlación y el tamaño de la muestra?

Antecedentes: leí un artículo donde los autores informan la correlación de Pearson 0.754 del tamaño de la muestra 878. El valor p resultante para la prueba de correlación es "dos estrellas" significativo (es decir, p <0.01). Sin embargo, creo que con un tamaño de muestra tan grande, el valor p...

12
-tests vs -tests?

Estoy tratando de averiguar exactamente cuál es la diferencia entre las pruebas y las pruebas .tttzzz Por lo que puedo decir, para ambas clases de pruebas uno usa la misma estadística de prueba, algo de la forma b^−Cseˆ(b^)b^−Cse^(b^)\frac{\hat{b} - C}{\widehat{\operatorname{se}}(\hat{b})} donde...

12
Criterios para seleccionar el "mejor" modelo en un modelo oculto de Markov

Tengo un conjunto de datos de series temporales en el que estoy tratando de ajustar un Modelo de Markov Oculto (HMM) para estimar el número de estados latentes en los datos. Mi pseudo código para hacer esto es el siguiente: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states...

12
Prueba de hipótesis con Big Data

¿Cómo se realizan las pruebas de hipótesis con Big Data? Escribí el siguiente script de MATLAB para enfatizar mi confusión. Todo lo que hace es generar dos series aleatorias y ejecutar una regresión lineal simple de una variable sobre la otra. Realiza esta regresión varias veces utilizando...