Preguntas etiquetadas con regression

8
¿Por qué un modelo estadístico se sobreajusta si se le da un gran conjunto de datos?

Mi proyecto actual puede requerir que construya un modelo para predecir el comportamiento de un determinado grupo de personas. el conjunto de datos de entrenamiento contiene solo 6 variables (la identificación es solo para fines de identificación): id, age, income, gender, job category, monthly...

8
Elegir un modelo de regresión

¿Cómo puede uno objetivamente (leer "algorítmicamente") seleccionar un modelo apropiado para hacer una simple regresión lineal de mínimos cuadrados con dos variables? Por ejemplo, digamos que los datos parecen mostrar una tendencia cuadrática, y se genera una parábola que se ajusta bastante bien a...

8
¿Cómo calcular eficientemente el estimador Theil-Sen?

El estimador Theil-Sen me interesa, sin embargo, cuando lo implemento yo mismo termino con algo que se escala como O (n ^ 2). Según Wikipedia, se puede calcular exactamente en O (n log (n)). ¿Puede alguien señalarme hacia una implementación eficiente (Python o Mathica sería lo mejor, Matlab o R...