Veo que ambas funciones son parte de los métodos de minería de datos, como los regresores de aumento de gradiente . Veo que esos son objetos separados también. ¿Cómo es la relación entre ambos en
Veo que ambas funciones son parte de los métodos de minería de datos, como los regresores de aumento de gradiente . Veo que esos son objetos separados también. ¿Cómo es la relación entre ambos en
Para la regresión lineal simple, el coeficiente de regresión es calculable directamente a partir de la matriz de varianza-covarianza CCC , por Cd,eCe,eCd,eCe,e C_{d, e}\over C_{e,e} dondedddes el índice de la variable dependiente, yeeees el índice de la variable explicativa. Si uno solo tiene...
Tengo una pregunta sobre la semántica sobre la que me gustaría la opinión de otros estadísticos. Sabemos que modelos como el logístico, Poisson, etc. se encuentran bajo el paraguas de modelos lineales generalizados. El modelo incluye funciones no lineales de los parámetros, que a su vez pueden...
Leí el siguiente artículo: Perneger (1998) ¿Qué hay de malo con los ajustes de Bonferroni ? El autor resumió diciendo que el ajuste de Bonferroni tiene, en el mejor de los casos, aplicaciones limitadas en la investigación biomédica y no debe usarse al evaluar la evidencia sobre hipótesis...
Al demostrar que MSE se puede descomponer en varianza más el cuadrado de Bias, la prueba en Wikipedia tiene un paso, resaltado en la imagen. ¿Como funciona esto? ¿Cómo se empuja la expectativa al producto desde el tercer paso hasta el cuarto paso? Si los dos términos son independientes, ¿no debería...
Estoy tratando de resolver la siguiente pregunta: El jugador A ganó 17 de 25 juegos, mientras que el jugador B ganó 8 de 20: ¿hay una diferencia significativa entre ambas proporciones? Lo que hay que hacer en R que viene a la mente es lo siguiente: >
La pregunta es muy simple: ¿por qué, cuando tratamos de ajustar un modelo a nuestros datos, lineales o no lineales, generalmente tratamos de minimizar la suma de los cuadrados de errores para obtener nuestro estimador para el parámetro del modelo? ¿Por qué no elegir alguna otra función objetivo...
Así que estoy tratando de hacer un entrenamiento previo en imágenes de humanos usando redes convolucionales. Leí los documentos ( Paper1 y Paper2 ) y este enlace de stackoverflow , pero no estoy seguro de entender la estructura de las redes (no está bien definido en los
Estoy interesado en la selección de modelos en una configuración de series de tiempo. Para concreción, supongamos que quiero seleccionar un modelo ARMA de un grupo de modelos ARMA con diferentes órdenes de retraso. La intención final es pronosticar . La selección del modelo puede hacerse...
En cierto sentido, esta es una publicación cruzada mía de math.stackexchange , y tengo la sensación de que este sitio podría proporcionar una amplia audiencia. Estoy buscando una introducción matemática al aprendizaje automático. Particularmente, mucha literatura que se puede encontrar es...
Sé que si la mediana y la media son aproximadamente iguales, entonces esto significa que hay una distribución simétrica, pero en este caso particular no estoy seguro. La media y la mediana son bastante cercanas (solo una diferencia de 0.487m / gall) lo que me llevaría a decir que hay una...
Recién comencé a estudiar sobre estadísticas y modelos. Actualmente, entiendo que usamos MLE para estimar los mejores parámetros para un modelo. Sin embargo, cuando trato de entender cómo funcionan las redes neuronales, parece que comúnmente usan otro enfoque para estimar los parámetros. ¿Por qué...
Me preguntaba cuáles son los diferentes casos de uso para los dos algoritmos, Descenso de coordenadas y Descenso de gradiente . Sé que el descenso coordinado tiene problemas con las funciones no uniformes, pero se usa en algoritmos populares como SVM y LASSO. Sin embargo, creo que el descenso de...
En inferencia estadística , problema 9.6b, se menciona una "Región de mayor densidad (HDR)". Sin embargo, no encontré la definición de este término en el libro. Un término similar es la más alta densidad posterior (HPD). Pero no encaja en este contexto, ya que 9.6b no menciona nada sobre un...
Deje que y sean 2 iidrv's donde . Me gustaría saber la distribución de .X1X1X_1X2X2X_2log(X1),log(X2)∼N(μ,σ)log(X1),log(X2)∼N(μ,σ)\log(X_1),\log(X_2) \sim N(\mu,\sigma)X1−X2X1−X2X_1 - X_2 Lo mejor que puedo hacer es tomar la serie de Taylor de ambos y obtener que la diferencia es la suma de la...
Esta pregunta se ha hecho antes aquí y aquí, pero no creo que las respuestas aborden la pregunta directamente. ¿Los estudios con poca potencia tienen una mayor probabilidad de falsos positivos? Algunos artículos de noticias hacen esta afirmación. Por ejemplo : El bajo poder estadístico es una...
He estado tratando de entender la idea de conjugar los antecedentes en las estadísticas bayesianas por un tiempo, pero simplemente no lo entiendo. ¿Alguien puede explicar la idea en los términos más simples posibles, quizás utilizando el "previo gaussiano" como
Estaba leyendo este artículo en Nature en el que se explican algunas falacias en el contexto del análisis de datos. Noté que la falacia del tirador de Texas era particularmente difícil de evitar: La fábula del francotirador de Texas ilustra una trampa cognitiva que espera durante el análisis de...
Supongamos que he entrenado varios modelos en el conjunto de entrenamiento, elija el mejor usando el conjunto de validación cruzada y el rendimiento medido en el conjunto de prueba. Así que ahora tengo un mejor modelo final. ¿Debo volver a entrenarlo con todos mis datos disponibles o enviar una...
Esta pregunta se migró de Stack Overflow porque se puede responder en Cross Validated. Migrado hace 3 años . En las estadísticas estamos haciendo regresiones lineales, el comienzo de ellas. En general, sabemos que cuanto mayor sea el , mejor, pero ¿hay alguna situación en...