Estadísticas y Big Data

16
Agrupación de datos 1D

Tengo un conjunto de datos, quiero crear grupos en esos datos basados ​​en una sola variable (no faltan valores). Quiero crear 3 grupos basados ​​en esa variable. ¿Qué algoritmo de agrupamiento utilizar, k-means, EM, DBSCAN, etc.? Mi pregunta principal es, ¿en qué circunstancias debo usar k-means...

16
¿Cómo empezar y aprender R?

He intentado varias veces "hacerlo por mi cuenta", pero con un éxito limitado. Soy un usuario casual de SPSS y tengo experiencia en SAS. Agradecería un puntero o dos de alguien que tiene antecedentes similares y ahora usa

16
Hacer apuestas grandes e inteligentes

He estado tratando de codificar un algoritmo para sugerir apuestas en juegos 1X2 (ponderados). Básicamente, cada juego tiene un conjunto de partidos (equipos locales vs fuera): 1: casa gana X: dibujar 2: visitante gana Para cada coincidencia y símbolo ( 1, Xy 2), asignaré un porcentaje que...

16
Modelo lineal clásico - selección de modelo

Tengo un modelo lineal clásico, con 5 posibles regresores. No están correlacionados entre sí y tienen una correlación bastante baja con la respuesta. Llegué a un modelo donde 3 de los regresores tienen coeficientes significativos para su estadística t (p <0.05). Agregar una o las dos variables...

16
Interpretación de exp (B) en regresión logística multinomial

Esta es una pregunta para principiantes, pero ¿cómo se interpreta un resultado exp (B) de 6.012 en un modelo de regresión logística multinomial? 1) ¿es 6.012-1.0 = 5.012 = 5012% de aumento en el riesgo? o 2) 6.012 / (1 + 6.012) = 0.857 = 85.7% de aumento en el riesgo? En caso de que ambas...

16
¿Dónde encontrar un corpus de texto grande? [cerrado]

Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado hace 6 años . Estoy buscando un corpus de texto grande (>...

16
Velocidad de cálculo en R?

Se me ha encomendado la tarea de trasladar uno de nuestros modelos estocásticos grandes actuales de SAS a un nuevo idioma. Personalmente, prefiero un lenguaje compilado tradicional, pero el PI quiere que revise R, que nunca he usado. Nuestra motivación para sacar el modelo de SAS es (1) muchas...