Quiero decir que algunas de esas variables están fuertemente correlacionadas entre sí. ¿Cómo / por qué / en qué contexto los definimos como variables independientes
Quiero decir que algunas de esas variables están fuertemente correlacionadas entre sí. ¿Cómo / por qué / en qué contexto los definimos como variables independientes
Si la probabilidad conjunta es la intersección de 2 eventos, ¿no debería la probabilidad conjunta de 2 eventos independientes ser cero ya que no se cruzan en absoluto? Estoy
En matemáticas, hay ramas como álgebra, análisis, topología, etc. En el aprendizaje automático hay aprendizaje supervisado, no supervisado y de refuerzo. Dentro de cada una de estas ramas, hay ramas más finas que dividen aún más los métodos. Tengo problemas para trazar un paralelo con las...
Para los estimadores de densidad de kernel univariados (KDE), uso la regla de Silverman para calcular :hhh 0.9min(sd,IQR/1.34)×n−0.20.9min(sd,IQR/1.34)×n−0.2\begin{equation} 0.9 \min(sd, IQR/1.34)\times n^{-0.2} \end{equation} ¿Cuáles son las reglas estándar para KDE multivariante (suponiendo un...
¿Cuál es la selección de variables / características que prefiere para la clasificación binaria cuando hay muchas más variables / características que observaciones en el conjunto de aprendizaje? El objetivo aquí es discutir cuál es el procedimiento de selección de características que reduce mejor...
¿Cuáles son algunos podcasts relacionados con el análisis estadístico? He encontrado algunas grabaciones de audio de conferencias universitarias en iTunes U, pero no conozco ningún podcast estadístico. Lo más cercano que conozco es un podcast de investigación de operaciones The Science of Better ....
Estoy comparando una muestra y comprobando si se distribuye como una distribución discreta. Sin embargo, no estoy seguro de que se aplique Kolmogorov-Smirnov. Wikipedia parece implicar que no. Si no es así, ¿cómo puedo probar la distribución de la
En la tradicional paradoja del cumpleaños, la pregunta es "cuáles son las posibilidades de que dos o más personas en un grupo de personas compartan un cumpleaños". Estoy atrapado en un problema que es una extensión de esto.nnn En lugar de saber la probabilidad de que dos personas compartan un...
Me enseñaron a aplicar solo la prueba exacta de Fisher en tablas de contingencia que eran 2x2. Preguntas: ¿El propio Fisher alguna vez imaginó que esta prueba se usaría en tablas de más de 2x2? (Soy consciente de la historia de él ideando la prueba mientras intentaba adivinar si una anciana...
¿Es posible probar la finitud (o existencia) de la varianza de una variable aleatoria dada una muestra? Como nulo, o bien {la varianza existe y es finita} o {la varianza no existe / es infinita} sería aceptable. Filosóficamente (y computacionalmente), esto parece muy extraño porque no debería haber...
¿Cómo puedo probar la equidad de un dado de veinte lados (d20)? Obviamente estaría comparando la distribución de valores con una distribución uniforme. Recuerdo vagamente usar una prueba de Chi-cuadrado en la universidad. ¿Cómo puedo aplicar esto para ver si un dado es
Entonces, tengo un conjunto de porcentajes de datos como este: 100 / 10000 = 1% (0.01) 2 / 5 = 40% (0.4) 4 / 3 = 133% (1.3) 1000 / 2000 = 50% (0.5) Quiero encontrar la desviación estándar de los porcentajes, pero ponderada por su volumen de datos. es decir, el primer y último punto de datos...
Quiero aprender cómo funciona Gibbs Sampling y estoy buscando un buen papel básico a intermedio. Tengo experiencia en informática y conocimientos básicos de estadística. ¿Alguien ha leído buen material? donde lo
Utilizo la función auto.arima () en el paquete de pronóstico para ajustar los modelos ARMAX con una variedad de covariables. Sin embargo, a menudo tengo una gran cantidad de variables para seleccionar y generalmente termino con un modelo final que funciona con un subconjunto de ellas. No me gustan...
Siempre uso lm()en R para realizar una regresión lineal de en . Esa función devuelve un coeficiente tal queyyyXxxββ\betay= βx .y=βx.y = \beta x. Hoy aprendí sobre mínimos cuadrados totales y esa princomp()función (análisis de componentes principales, PCA) se puede utilizar para realizarla. Debería...
Soy bastante nuevo en estadísticas y necesito tu ayuda. Tengo una pequeña muestra, como sigue: H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 Ejecuté la prueba de Shapiro-Wilk usando R: shapiro.test(precisionH4U$H4U) y obtuve el siguiente resultado: W = 0.9502, p-value =...
Me parece que solo dos paquetes R pueden realizar la asignación de Dirichlet latente : Uno es lda, escrito por Jonathan Chang; y el otro es topicmodelsescrito por Bettina Grün y Kurt Hornik. ¿Cuáles son las diferencias entre estos dos paquetes, en términos de rendimiento, detalles de...
¿Hay alguna manera en R (una función incorporada) para calcular la matriz de transición para una cadena de Markov a partir de un conjunto de observaciones? Por ejemplo, ¿tomar un conjunto de datos como el siguiente y calcular la matriz de transición de primer
La probabilidad aplicada es una rama importante en la probabilidad, incluida la probabilidad computacional. Dado que las estadísticas utilizan la teoría de la probabilidad para construir modelos para tratar con datos, según tengo entendido, me pregunto cuál es la diferencia esencial entre el modelo...
Solo estoy tratando de replicar una afirmación hecha en el siguiente documento, Buscando Biclusters correlacionados a partir de datos de expresión génica , que es: Proposición 4. Si . entonces tenemos:XyoJ= RyodoTJXyoJ=RyodoJTX_{IJ}=R_{I}C^{T}_{J} yo. Si es un bicluster perfecto con modelo...