Vengo de las ciencias sociales, donde p <0.05 es más o menos la norma, con p <0.1 y p <0.01 también apareciendo, pero me preguntaba: ¿qué campos de estudio, si los hay, usan valores p más bajos como un común?
Vengo de las ciencias sociales, donde p <0.05 es más o menos la norma, con p <0.1 y p <0.01 también apareciendo, pero me preguntaba: ¿qué campos de estudio, si los hay, usan valores p más bajos como un común?
¿Qué significa que un estudio tenga demasiada potencia? Mi impresión es que significa que sus tamaños de muestra son tan grandes que tiene el poder de detectar tamaños de efectos minúsculos. Estos tamaños de efectos son quizás tan pequeños que es más probable que resulten de sesgos leves en el...
Tengo el número total de llamadas recibidas cada semana y las he trazado en un gráfico, desde hace casi 3 años. A simple vista, parece que hubo una caída masiva durante la Navidad, que no parece haberse recuperado, parece que ha habido un cambio radical en las solicitudes. ¿Hay alguna prueba que...
Estoy leyendo Gelman y Carlin "Más allá de los cálculos de potencia: evaluación de errores tipo S (signo) y tipo M (magnitud)" (2014). Estoy tratando de entender la idea principal, la idea principal, pero estoy confundido. ¿Podría alguien ayudarme a destilarme la esencia? El papel va más o menos...
Cuando analizo mis variables en dos modelos de regresión logística separados (univariados), obtengo lo siguiente: Predictor 1: B= 1.049, SE=.352, Exp(B)=2.85, 95% CI=(1.43, 5.69), p=.003 Constant: B=-0.434, SE=.217, Exp(B)=0.65, p=.046 Predictor 2: B= 1.379, SE=.386, Exp(B)=3.97, 95% CI=(1.86,...
Mi pregunta es bastante semántica. Cuando un método produce rutinariamente valores p altos, se llama conservador. ¿Llamarías lo contrario, es decir, un método con una alta tasa de error tipo II
Si alguien hace una declaración como la siguiente: "En general, los no fumadores expuestos al humo ambiental tenían un riesgo relativo de enfermedad coronaria de 1,25 (intervalo de confianza del 95 por ciento, 1,17 a 1,32) en comparación con los no fumadores no expuestos al humo". ¿Cuál es el...
Antecedentes: tuve que realizar un análisis de datos para un cliente (algún tipo de abogado) que era un principiante absoluto en estadística. Me preguntó qué significa el término "significación estadística" y realmente intenté explicarlo ... pero como no soy bueno para explicar cosas,...
He estado utilizando el método de extracción de red troncal descrito en este documento: http://www.pnas.org/content/106/16/6483.abstract Básicamente, los autores proponen un método basado en estadísticas que produce una probabilidad, para cada borde en el gráfico, de que el borde podría haber...
Descargo de responsabilidad: si considera que esta pregunta es demasiado similar a otra, me alegra que se fusione. Sin embargo, no encontré una respuesta satisfactoria en ningún otro lugar (y todavía no tengo la "reputación" de comentar o votar), así que pensé que sería mejor hacer una nueva...
El otro día, un seminario web realizado por una compañía de pruebas a / b hizo que su "Científico de datos" residente explicara que debe validar sus resultados volviendo a ejecutar el experimento. La premisa era que, si selecciona un 95% de confianza, hay un 5% (1/20) de probabilidad de un falso...
En PCA, los valores propios determinan el orden de los componentes. En ICA estoy usando curtosis para obtener el pedido. ¿Cuáles son algunos métodos aceptados para evaluar el número, (dado que tengo el orden) de componentes que son singulares aparte del conocimiento previo sobre la...
He calculado una matriz de correlación de un conjunto de datos que contiene 455 puntos de datos, cada punto de datos contiene 14 características. Entonces la dimensión de la matriz de correlación es 14 x 14. Me preguntaba si hay un umbral para el valor del coeficiente de correlación que señala que...
Tengo una máquina prototipo que produce piezas. En una primera prueba, la máquina produce partes y un clasificador binario me dice que partes son defectuosas ( d_1 <N_1 , generalmente d_1 / N_1 <0.01 y N_1 \ approx10 ^ 4 ) y las partes N_1-d_1 son buenas.d 1 d 1 < N 1 d 1 / N 1 < 0.01...
Estoy trabajando en la predicción de series de tiempo. Tengo dos conjuntos de datos y . Tengo tres modelos de predicción: . Todos esos modelos se entrenan utilizando muestras en el conjunto de datos , y su rendimiento se mide utilizando las muestras en el conjunto de datos . Digamos que las...
¿Cuál es la forma correcta de probar la importancia de las relaciones de Sharpe o las relaciones de información? Los índices de Sharpe se basarán en varios índices de renta variable y pueden tener períodos de recuperación variables. Una solución que he visto descrita simplemente aplica una prueba...
Estoy trabajando en un conjunto de datos. Después de usar algunas técnicas de identificación de modelos, obtuve un modelo ARIMA (0,2,1). Utilicé la detectIOfunción en el paquete TSAen R para detectar un valor atípico innovador (IO) en la observación número 48 de mi conjunto de datos...
Usando bootstrap calculo p valores de pruebas de significación usando dos métodos: remuestreo bajo la hipótesis nula y contando los resultados al menos tan extremos como el resultado proveniente de los datos originales remuestreo bajo la hipótesis alternativa y contando los resultados al menos...
Tengo dos muestras de datos, una muestra de referencia y una muestra de tratamiento. La hipótesis es que la muestra de tratamiento tiene una media más alta que la muestra de referencia. Ambas muestras tienen forma exponencial. Como los datos son bastante grandes, solo tengo la media y el número...
A partir del título, me gustaría saber si existe una prueba estadística que pueda ayudarme a identificar una divergencia significativa entre dos series de tiempo similares. Específicamente, mirando la figura a continuación, me gustaría detectar que las series comienzan a divergir en el tiempo t1,...