Estadísticas y Big Data

8
¿Por qué querría arrancar al calcular una prueba t de muestra independiente? (cómo justificar, interpretar e informar una prueba t de arranque)

Digamos que tengo dos condiciones, y el tamaño de mi muestra para las dos condiciones es extremadamente bajo. Digamos que solo tengo 14 observaciones en la primera condición y 11 en la otra. Quiero usar la prueba t para probar si las diferencias de medias son significativamente diferentes entre...

8
Convierta la razón de riesgos en odds ratio

En el metanálisis: ¿cómo convertimos las razones de riesgo en algunos estudios en odds ratio? Se deben incluir estudios de casos y controles de cohortes y algunos de ellos informan las razones de riesgo. Los datos sin procesar no se informan para calcular la razón de

8
Términos de error vs innovaciones

Noté que a veces llamamos a los términos de error "innovaciones". No entiendo si esto es en situaciones especiales o si estos términos pueden usarse uno para el otro. Entonces, otra pregunta es "¿por qué llamamos a los términos de error" innovaciones "?

8
Revisión de papel sobre filtro de partículas

Encontré en línea un borrador de un excelente artículo de revisión de Zhe Chen titulado "Filtrado bayesiano: de los filtros de Kalman a los filtros de partículas, y más allá". Según Google Scholar, la cita de la versión publicada es "Estadísticas 182 (1), 1-69, 2003", pero la revista que encuentro...

8
Fórmula de Schuette-Nesbitt

Estaba leyendo el artículo sobre la fórmula de Schuette-Nesbitt , que se describe como "una generalización del principio de inclusión-exclusión" , que tiene versiones combinatorias y probabilísticas. Otro sitio web proporcionó una prueba de eventos dependientes (descarga en pdf) , y encontró un...

8
Trabajando con la muestra bootstrap vs la muestra original

Considere una muestra de números reales. Digamos que queremos estimar la tendencia central de la población y tener una idea de nuestra incertidumbre en torno a esta estimación. Pongamos a un lado las suposiciones sobre la distribución de la población por un momento, y consideremos los siguientes...

8
¿Cuáles son algunas de las razones por las que los mínimos cuadrados reponderados iterativamente no convergerían cuando se usaran para la regresión logística?

He estado usando la función glm.fit en R para ajustar parámetros a un modelo de regresión logística. Por defecto, glm.fit utiliza mínimos cuadrados repesados ​​de forma iterativa para ajustar los parámetros. ¿Cuáles son algunas razones por las cuales este algoritmo no podría converger, cuando se...

8
Visualización y sobreplotting: alternativa a los scatters

Tengo un gran conjunto de datos de países que están llenos (como puede ver a continuación), pero necesito las etiquetas y los valores atípicos: también tengo muchos gráficos, por lo que sería tedioso restablecer la ventana y agregar puntos de datos falsos para los atípicos. ¿Existe una buena...