Preguntas etiquetadas con statistical-significance

37

¿Cuándo se debe incluir una variable en una regresión a pesar de que no sea estadísticamente significativa?

Soy un estudiante de economía con algo de experiencia con econometría y R. Me gustaría saber si alguna vez hay una situación en la que deberíamos incluir una variable en una regresión a pesar de que no sea estadísticamente

statistical-significance feature-selection

37

Pruebe si dos distribuciones binomiales son estadísticamente diferentes entre sí

Tengo tres grupos de datos, cada uno con una distribución binomial (es decir, cada grupo tiene elementos que son exitosos o fallidos). No tengo una probabilidad pronosticada de éxito, sino que solo puedo confiar en la tasa de éxito de cada uno como una aproximación a la verdadera tasa de éxito....

statistical-significance binomial bernoulli-distribution

36

¿Es el valor p esencialmente inútil y peligroso de usar?

Este artículo " The Odds, Continually Updates" del NY Times me llamó la atención. Para ser breve, afirma que [Las estadísticas bayesianas] están demostrando ser especialmente útiles para abordar problemas complejos, incluidas búsquedas como la que la Guardia Costera usó en 2013 para encontrar al...

hypothesis-testing statistical-significance bayesian p-value reproducible-research

35

Regresión logística: prueba de chi-cuadrado de anova versus significancia de coeficientes (anova () versus resumen () en R)

Tengo un modelo logístico GLM con 8 variables. Realicé una prueba de chi-cuadrado en R anova(glm.model,test='Chisq')y 2 de las variables resultan ser predictivas cuando se ordenan en la parte superior de la prueba y no tanto cuando se ordenan en la parte inferior. El summary(glm.model)sugiere que...

r regression logistic statistical-significance generalized-linear-model

31

¿Los valores p más pequeños son más convincentes?

He estado leyendo sobre valores , tasas de error tipo 1, niveles de significancia, cálculos de potencia, tamaños de efectos y el debate de Fisher vs Neyman-Pearson. Esto me ha dejado un poco abrumado. Pido disculpas por el muro de texto, pero sentí que era necesario proporcionar una visión general...

hypothesis-testing statistical-significance confidence-interval p-value effect-size

31

¿El valor exacto de un "valor p" no tiene sentido?

Tuve una discusión con un estadístico en 2009 donde afirmó que el valor exacto de un valor p es irrelevante: lo único que es importante es si es significativo o no. Es decir, un resultado no puede ser más significativo que otro; sus muestras, por ejemplo, provienen de la misma población o...

statistical-significance p-value bonferroni

31

¿Por qué los valores p más bajos no son más pruebas contra el nulo? Argumentos de Johansson 2011

Johansson (2011) en " Salve lo imposible: valores p, evidencia y probabilidad " (aquí también hay un enlace a la revista ) afirma que los valores más bajos a menudo se consideran como una evidencia más fuerte contra el nulo. Johansson implica que las personas considerarían que la evidencia contra...

hypothesis-testing statistical-significance p-value philosophical

30

¿Cómo debe pensar un investigador individual sobre la tasa de descubrimiento falso?

He estado tratando de entender cómo la tasa de descubrimiento falso (FDR) debería informar las conclusiones del investigador individual. Por ejemplo, si su estudio tiene poca potencia, ¿debería descontar sus resultados incluso si son significativos en ? Nota: estoy hablando del FDR en el contexto...

statistical-significance p-value publication-bias false-discovery-rate

30

¿Cuál es la diferencia entre la prueba de normalidad de Shapiro-Wilk y la prueba de normalidad de Kolmogorov-Smirnov?

¿Cuál es la diferencia entre la prueba de normalidad de Shapiro-Wilk y la prueba de normalidad de Kolmogorov-Smirnov? ¿Cuándo diferirán los resultados de estos dos

distributions statistical-significance normality-assumption kolmogorov-smirnov

30

¿Prueba estadística para determinar si dos muestras se extraen de la misma población?

Digamos que tengo dos muestras. Si quiero saber si provienen de diferentes poblaciones, puedo ejecutar una prueba t. Pero digamos que quiero probar si las muestras son de la misma población. ¿Cómo se hace esto? Es decir, ¿cómo calculo la probabilidad estadística de que estas dos muestras se...

statistical-significance

29

¿Puede ANOVA ser significativo cuando ninguna de las pruebas t por pares lo es?

¿Es posible que el ANOVA unidireccional (con grupos o "niveles") informe una diferencia significativa cuando ninguna de las pruebas t por pares N ( N - 1 ) / 2 lo hace?norte> 2norte>2N>2norte( N- 1 ) / 2norte(norte-1)/ /2N(N-1)/2 En esta respuesta, @whuber escribió: Es bien sabido que una...

statistical-significance anova t-test post-hoc

29

¿Puede un metanálisis de estudios que son todos "no estadísticamente significativos" llevar a una conclusión "significativa"?

Un metanálisis incluye un grupo de estudios, todos los cuales informaron un valor de P mayor que 0.05. ¿Es posible que el metanálisis general informe un valor de P menor que 0.05? ¿Bajo que circunstancias? (Estoy bastante seguro de que la respuesta es sí, pero me gustaría una referencia o...

statistical-significance meta-analysis combining-p-values

28

La abundancia de valores de P en ausencia de una hipótesis

Estoy en epidemiología. No soy estadístico, pero trato de realizar los análisis yo mismo, aunque a menudo encuentro dificultades. Hice mi primer análisis hace unos 2 años. Los valores de P se incluyeron en todas partes en mis análisis (simplemente hice lo que otros investigadores estaban haciendo)...

probability hypothesis-testing statistical-significance p-value

28

Calcular la repetibilidad de los efectos de un modelo más antiguo

Acabo de encontrar este artículo , que describe cómo calcular la repetibilidad (también conocida como confiabilidad, también conocida como correlación intraclase) de una medición a través del modelado de efectos mixtos. El código R sería: #fit the model fit =

mixed-model reliability intraclass-correlation repeatability spss factor-analysis survey modeling cross-validation error curve-fitting mediation correlation clustering sampling machine-learning probability classification metric r project-management optimization svm python dataset quality-control checking clustering distributions anova factor-analysis exponential poisson-distribution generalized-linear-model deviance machine-learning k-nearest-neighbour r hypothesis-testing t-test r variance levenes-test bayesian software bayesian-network regression repeated-measures least-squares change-scores variance chi-squared variance nonlinear-regression regression-coefficients multiple-comparisons p-value r statistical-significance excel sampling sample r distributions interpretation goodness-of-fit normality-assumption probability self-study distributions references theory time-series clustering econometrics binomial hypothesis-testing variance t-test paired-comparisons statistical-significance ab-test r references hypothesis-testing t-test normality-assumption wilcoxon-mann-whitney central-limit-theorem t-test data-visualization interactive-visualization goodness-of-fit

27

¿Pueden los grados de libertad ser un número no entero?

Cuando uso GAM, me da un DF residual de 26.626.626.6 (última línea en el código). Qué significa eso? Yendo más allá del ejemplo de GAM, en general, ¿puede el número de grados de libertad ser un número no entero? > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~...

r degrees-of-freedom gam machine-learning pca lasso probability self-study bootstrap expected-value regression machine-learning linear-model probability simulation random-generation machine-learning distributions svm libsvm classification pca multivariate-analysis feature-selection archaeology r regression dataset simulation r regression time-series forecasting predictive-models r mean sem lavaan machine-learning regularization regression conv-neural-network convolution classification deep-learning conv-neural-network regression categorical-data econometrics r confirmatory-factor scale-invariance self-study unbiased-estimator mse regression residuals sampling random-variable sample probability random-variable convergence r survival weibull references autocorrelation hypothesis-testing distributions correlation regression statistical-significance regression-coefficients univariate categorical-data chi-squared regression machine-learning multiple-regression categorical-data linear-model pca factor-analysis factor-rotation classification scikit-learn logistic p-value regression panel-data multilevel-analysis variance bootstrap bias probability r distributions interquartile time-series hypothesis-testing normal-distribution normality-assumption kurtosis arima panel-data stata clustered-standard-errors machine-learning optimization lasso multivariate-analysis ancova machine-learning cross-validation

27

¿Qué causa la discontinuidad en la distribución de los valores p publicados en p <.05?

En un artículo reciente , Masicampo y Lalande (ML) recolectaron una gran cantidad de valores p publicados en muchos estudios diferentes. Observaron un curioso salto en el histograma de los valores p justo en el nivel crítico canónico del 5%. Hay una buena discusión sobre este fenómeno de ML en el...

statistical-significance p-value meta-analysis

26

¿Se puede extender la prueba de Mantel a matrices asimétricas?

La prueba de Mantel generalmente se aplica a matrices simétricas de distancia / diferencia. Según tengo entendido, una suposición de la prueba es que la medida utilizada para definir las diferencias debe ser al menos semimétrica (cumplir con los requisitos estándar de una métrica pero no la...

statistical-significance assumptions distance

25

¿Por qué funciona la prueba de Kolmogorov-Smirnov?

Al leer sobre la prueba KS de 2 muestras, entiendo exactamente lo que está haciendo, pero no entiendo por qué funciona . En otras palabras, puedo seguir todos los pasos para calcular las funciones de distribución empírica, encontrar la diferencia máxima entre los dos para encontrar el estadístico...

distributions statistical-significance nonparametric kolmogorov-smirnov

25

Ziliak (2011) se opone al uso de valores p y menciona algunas alternativas; ¿Qué son?

En un artículo reciente sobre los deméritos de confiar en el valor p para la inferencia estadística, llamado "Matrixx v. Siracusano y Student v. Fisher Significación estadística en el juicio" (DOI: 10.1111 / j.1740-9713.2011.00511.x), Stephen T. Ziliak se opone al uso de valores p. En los párrafos...

r hypothesis-testing statistical-significance bayesian p-value

24

Corrección de los valores de p para múltiples pruebas donde las pruebas están correlacionadas (genética)

Tengo valores de p de muchas pruebas y me gustaría saber si realmente hay algo significativo después de corregir las pruebas múltiples. La complicación: mis pruebas no son independientes. El método en el que estoy pensando (una variante del Método del producto de Fisher, Zaykin et al., Genet...

correlation multiple-comparisons statistical-significance genetics