Estadísticas y Big Data

10
Cómo hacer análisis ROC en R con un modelo de Cox

He creado algunos modelos de regresión de Cox y me gustaría ver qué tan bien funcionan estos modelos y pensé que quizás una curva ROC o una estadística c podría ser útil de manera similar al uso de estos artículos: JN Armitage och JH van der Meulen, "Identificar la comorbilidad en pacientes...

10
¿Cómo agrupar variables longitudinales?

Tengo un montón de variables que contienen datos longitudinales desde el día 0 hasta el día 7. Estoy buscando un enfoque de agrupamiento apropiado que pueda agrupar estas variables longitudinales (no casos) en diferentes grupos. Traté de analizar este conjunto de datos por separado por tiempo, pero...

10
Estadísticas para sitios de citas en línea

Tengo curiosidad por saber cómo un sistema de citas en línea podría usar datos de encuestas para determinar coincidencias. Supongamos que tienen datos de resultados de partidos pasados ​​(p. Ej., 1 = felizmente casados, 0 = sin segunda fecha). A continuación, supongamos que tenían 2 preguntas de...

10
Objeciones a la aleatorización

En Ensayos clínicos: una perspectiva metodológica , Steven Piantadosi escribe (cap.13, p. 334): En el Capítulo 2, noté las objeciones a la aleatorización de Abel y Koch (1997) y Urbach (1993), e indiqué el valor de estudiar sus preocupaciones y posibles errores. Rechazan la aleatorización como...

10
Número esperado de cartas invisibles al robar

Tenemos un mazo de cartas. Extraemos cartas de manera uniforme al azar con reemplazo. Después de 2 n sorteos, ¿cuál es el número esperado de cartas nunca elegidas?nnn2n2n2n Esta pregunta es la parte 2 del problema 2.12 en M. Mitzenmacher y E. Upfal, Probability and Computing: Randomized...

10
Bosque aleatorio en datos agrupados

Estoy usando un bosque aleatorio en datos agrupados de alta dimensión (50 variables de entrada numéricas) que tienen una estructura jerárquica. Los datos se recopilaron con 6 repeticiones en 30 posiciones de 70 objetos diferentes, lo que resultó en 12600 puntos de datos, que no son...

10
Tamaño del árbol en el impulso del árbol degradado

El refuerzo del árbol de gradiente propuesto por Friedman utiliza árboles de decisión con Jnodos terminales (= hojas) como aprendices básicos. Hay varias formas de hacer crecer un árbol con Jnodos exactos, por ejemplo, uno puede hacer crecer el árbol de una manera profunda o de primera, ... ¿Hay...