No estoy muy seguro de qué son exactamente VectorSource y VCorpus en el paquete 'tm'. La documentación no está clara sobre estos, ¿alguien puede hacerme entender en términos
No estoy muy seguro de qué son exactamente VectorSource y VCorpus en el paquete 'tm'. La documentación no está clara sobre estos, ¿alguien puede hacerme entender en términos
Estoy luchando con la implementación del estimador de máxima verosimilitud para un proceso de Hawkes (HP) multivariante. Específicamente, aunque la expresión analítica para una función de probabilidad logarítmica de un HP univariante se puede encontrar fácilmente en línea (por ejemplo, Ozaki,...
Mi libro de texto enumera el idf como dondel o g( 1 + Nnortet)log(1+Nnt)log(1+\frac{N}{n_t}) norteNN : número de documentos nortetntn_t : número de documentos que contienen el términottt Wikipedia enumera esta fórmula como una versión suavizada del real . Eso lo entiendo: varía de a que parece...
Observé que Caffe (un marco de aprendizaje profundo) utilizó la capa de pérdida Softmax SoftmaxWithLoss como capa de salida para la mayoría de las muestras de modelos . Hasta donde sé, la capa de pérdida Softmax es la combinación de la capa de pérdida logística multinomial y la capa Softmax...
Supongamos que tengo un experimento con dos o más factores. Se construye un ANOVA general, y luego hacemos un seguimiento con dos o más conjuntos de pruebas post hoc , por ejemplo, comparaciones múltiples. Mi pregunta es acerca de qué tan grandes y cuántas familias deben usarse como base para los...
En mi libro de texto econométrico (Econometría introductoria) que cubre OLS, el autor escribe: "SSR debe caer cuando se agrega otra variable explicativa". Por que
Estoy usando lmer en R para verificar el efecto de la condición ( cond) en algún resultado. Aquí están algunos hechos de seguridad de datos, donde s es el identificador de objeto y a, by cson condiciones. library("tidyr") library("dplyr") set.seed(123) temp <- data.frame(s = paste0("S", 1:30),...
Tengo datos mensuales de 1993 a 2015 y me gustaría hacer pronósticos sobre estos datos. Utilicé el paquete tsoutliers para detectar los valores atípicos, pero no sé cómo continúo pronosticando con mi conjunto de datos. Este es mi
La arimaxfunción en el TSApaquete es, que yo sepa, el único Rpaquete que se ajustará a una función de transferencia para los modelos de intervención. Sin embargo, carece de una función de predicción que a veces es necesaria. ¿Es lo siguiente una solución alternativa para este problema,...
Problema Me gustaría hacer alguna inferencia en un sistema análogo a morir con un número desconocido de lados. El dado se tira varias veces, después de lo cual me gustaría inferir una distribución de probabilidad sobre un parámetro correspondiente al número de lados que tiene el dado,...
¿Es racional (teórico, sustancial, estadístico) optar por el aprendizaje automático o los modelos de peligro al modelar la rotación de clientes (o más general,
Tengo NNN (~ un millón) vectores de características. Hay MMM (~ un millón) características binarias, pero en cada vector solo KKK (~ mil) de ellas serían 111 , el resto son 000 . Estoy buscando los pares de vectores que tienen al menos LLL (~ cien) características en común ( 111 en ambos). El...
He estado tratando de establecer la desigualdad |Ti|=∣∣Xi−X¯∣∣S≤n−1n−−√|Ti|=|Xi−X¯|S≤n−1n\left| T_i \right|=\frac{\left|X_i -\bar{X} \right|}{S} \leq\frac{n-1}{\sqrt{n}} donde es la media muestral y la desviación estándar muestral, es decir
Supongamos que estamos tratando con este conjunto de datos donde es una variable continua (por ejemplo, Exponencial) y es una distribución discreta (por ejemplo, Poisson) para . Digamos que es la correlación entre y . ¿Cómo puede alguien definir ? (Xi,Ni)(Xi,Ni)(X_i,
Tengo un conjunto de datos de más de 1000 muestras de 19 variables. Mi objetivo es predecir una variable binaria basada en las otras 18 variables (binarias y continuas). Estoy bastante seguro de que 6 de las variables de predicción están asociadas con la respuesta binaria, sin embargo, me gustaría...
Considere una distribución diferenciable y simétrica dos veces . Ahora considere una segunda distribución dos veces diferenciable F Z derecha sesgada en el sentido de que:FXFX\mathcal{F}_XFZFZ\mathcal{F}_Z ( 1 )FX⪯CFZ.(1)FX⪯cFZ.(1)\quad\mathcal{F}_X\preceq_c\mathcal{F}_Z. donde es el orden...
Parte de una serie de intentos de entender Bayesiano vs Frecuente: 1 2 3 4 5 6 7 Creo que obtengo la diferencia de cómo los bayesianos y los frecuentistas abordan la elección entre hipótesis , pero no estoy muy seguro de si eso o cómo se supone que me explique cómo ven la probabilidad. Por lo que...
Un factor Bayes se define en las pruebas bayesianas de hipótesis y en la selección del modelo bayesiano por la razón de dos probabilidades marginales: dada una muestra iid y las respectivas densidades de muestreo y , con los precedentes correspondientes y \ pi_2 , el factor de Bayes para comparar...
Leí en un libro de aprendizaje automático que los parámetros de regresión lineal se pueden estimar (entre otros métodos) por descenso de gradiente, mientras que los parámetros de regresión logística generalmente se estiman por estimación de máxima verosimilitud. ¿Es posible explicarle a un novato...
Esta pregunta se refiere a la probabilidad de éxito en un juego de rol. Sin embargo, la pregunta y sus respuestas no cubren algunas de las complejidades de la mecánica de los dados. En particular, no cubre los fallos (un posible resultado) en absoluto. Un jugador tiene un grupo de dados, basado en...