Estadísticas y Big Data

77
¿Cuándo es R al cuadrado negativo?

Entiendo que no puede ser negativo ya que es el cuadrado de R. Sin embargo, ejecuté una regresión lineal simple en SPSS con una sola variable independiente y una variable dependiente. Mi salida SPSS me da un valor negativo para . Si tuviera que calcular esto a mano desde R, entonces sería positivo....

76
Selección de características para el modelo "final" cuando se realiza la validación cruzada en el aprendizaje automático

Estoy un poco confundido acerca de la selección de funciones y el aprendizaje automático y me preguntaba si podrían ayudarme. Tengo un conjunto de datos de microarrays que se clasifica en dos grupos y tiene miles de características. Mi objetivo es obtener una pequeña cantidad de genes (mis...

75
Métodos de remuestreo / simulación: monte carlo, bootstrapping, jackknifing, validación cruzada, pruebas de aleatorización y pruebas de permutación

Estoy tratando de entender la diferencia entre los diferentes métodos de remuestreo (simulación Monte Carlo, bootstrapping paramétrico, bootstrapping no paramétrico, jackknifing, validación cruzada, pruebas de aleatorización y pruebas de permutación) y su implementación en mi propio contexto usando...

75
Por favor explique la paradoja que espera

Hace unos años diseñé un detector de radiación que funciona midiendo el intervalo entre eventos en lugar de contarlos. Mi suposición era que, al medir muestras no contiguas, en promedio mediría la mitad del intervalo real. Sin embargo, cuando probé el circuito con una fuente calibrada, la lectura...

74
¿Qué es la regularización en inglés simple?

A diferencia de otros artículos, encontré que la entrada de Wikipedia para este tema es ilegible para una persona que no es matemática (como yo). Comprendí la idea básica, que favoreces modelos con menos reglas. Lo que no entiendo es cómo pasas de un conjunto de reglas a un "puntaje de...

74
¿Diagnósticos para regresión logística?

Para la regresión lineal, podemos verificar las gráficas de diagnóstico (gráficas de residuos, gráficas QQ normales, etc.) para verificar si se violan los supuestos de la regresión lineal. Para la regresión logística, tengo problemas para encontrar recursos que expliquen cómo diagnosticar el...