¿Por qué y cuándo debemos usar la información mutua sobre las medidas de correlación estadística como "Pearson", "spearman" o "Kendall's
la información mutua es un concepto de la teoría de la información. Es una medida de dependencia conjunta entre dos variables aleatorias, que no se limita, como el coeficiente de correlación habitual, a las variables escalares.
¿Por qué y cuándo debemos usar la información mutua sobre las medidas de correlación estadística como "Pearson", "spearman" o "Kendall's
Más recientemente, leí dos artículos. El primero trata sobre el historial de la correlación y el segundo trata sobre el nuevo método llamado Coeficiente de información máximo (MIC). Necesito su ayuda para comprender el método MIC para estimar correlaciones no lineales entre variables. Además, las...
Supongamos que tengo dos conjuntos e y una distribución de probabilidad conjunta sobre estos conjuntos . Supongamos que y denotan las distribuciones marginales sobre e respectivamente.XXXYYYp(x,y)p(x,y)p(x,y)p(x)p(x)p(x)p(y)p(y)p(y)XXXYYY La información mutua entre e se define
mi pregunta se aplica particularmente a la reconstrucción de
He trabajado con la información mutua por algún tiempo. Pero encontré una medida muy reciente en el "mundo de correlación" que también se puede usar para medir la independencia de distribución, la llamada "correlación de distancia" (también denominada correlación browniana):...
Las pruebas de permutación (también llamadas prueba de aleatorización, prueba de aleatorización o prueba exacta) son muy útiles y resultan útiles cuando t-testno se cumple el supuesto de distribución normal requerido por ejemplo y cuando se transforman los valores mediante la clasificación de...
Al observar los vectores propios de la matriz de covarianza, obtenemos las direcciones de varianza máxima (el primer vector propio es la dirección en la que los datos varían más, etc.); Esto se llama análisis de componentes principales (PCA). Me preguntaba qué significaría mirar los vectores /...
En cuanto al título, la idea es utilizar información mutua, aquí y después de MI, para estimar la "correlación" (definida como "cuánto sé sobre A cuando sé B") entre una variable continua y una variable categórica. Le diré mis pensamientos sobre el asunto en un momento, pero antes de aconsejarle...
¿Podría la información mutua sobre la entropía conjunta: 0 ≤ I( X, Y)H( X, Y)≤ 10≤I(X,Y)H(X,Y)≤1 0 \leq \frac{I(X,Y)}{H(X,Y)} \leq 1 se define como: "¿La probabilidad de transmitir una información de X a Y"? Lamento ser tan ingenuo, pero nunca he estudiado teoría de la información, y estoy...
Una forma de generar incrustaciones de palabras es la siguiente ( espejo ): Obtenga un corpus, por ejemplo, "Me gusta volar. Me gusta la PNL. Me gusta el aprendizaje profundo". Construya la matriz de concordancia de palabras a partir de ella: Realice SVD en y mantenga las primeras columnas...
Tengo una duda muy básica. Lo siento si esto irrita a algunos. Sé que el valor de la información mutua debe ser mayor que 0, pero ¿debe ser menor que 1? ¿Está limitado por algún valor superior? Gracias
Aquí, "peso de la evidencia" (WOE) es un término común en la literatura científica y de formulación de políticas publicada, más a menudo visto en el contexto de la evaluación de riesgos, definido por: w ( e : h ) = logp ( e | h )p ( e | h¯¯¯)w(e:h)=logp(e|h)p(e|h¯)w(e : h) =...
He visto un par de charlas de no estadísticos donde parecen reinventar las medidas de correlación utilizando información mutua en lugar de regresión (o pruebas estadísticas equivalentes / estrechamente relacionadas). Supongo que hay una buena razón por la cual los estadísticos no toman este...
Estoy un poco confundido. ¿Alguien puede explicarme cómo calcular la información mutua entre dos términos en base a una matriz de documentos de términos con ocurrencia de términos binarios como ponderaciones? D o c u m e n t 1D o c u m e n t 2D o c u m e n t 3′Wh y′111′Ho w′10 01′Wh e n′111′Wh e r...
Estoy tratando de aplicar la idea de información mutua a la selección de funciones, como se describe en estas notas de clase (en la página 5). Mi plataforma es Matlab. Un problema que encuentro al calcular información mutua a partir de datos empíricos es que el número siempre está sesgado hacia...
Quiero cuantificar la relación entre dos variables, A y B, utilizando información mutua. La forma de calcularlo es agrupando las observaciones (ver ejemplo de código Python a continuación). Sin embargo, ¿qué factores determinan qué número de contenedores es razonable? Necesito que el cálculo sea...
Supongamos que tengo una muestra de frecuencias de 4 eventos posibles: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 y tengo las probabilidades esperadas de que ocurran mis eventos: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Con la suma de las frecuencias observadas de mis cuatro eventos (18) puedo calcular las...
Tengo problemas para desarrollar cierta intuición sobre la entropía conjunta. = incertidumbre en la distribución conjunta p ( x , y ) ; H ( X ) = incertidumbre en p x ( x ) ; H ( Y ) = incertidumbre en p y ( y ) .H( X, Y)H(X,Y)H(X,Y)p ( x , y)p(x,y)p(x,y)H( X)H(X)H(X)pagX( x )pagX(X)p_x(x)H(...
Estoy tratando de entender la forma normalizada de información mutua puntual. n p m i = p m i ( x , y)l o g( p ( x , y) )npmi=pmi(x,y)log(p(x,y))npmi = \frac{pmi(x,y)}{log(p(x,y))} ¿Por qué la probabilidad conjunta logarítmica normaliza la información mutua puntual entre [-1, 1]? La información...
¿Cuál es la diferencia entre la correlación cruzada y la información mutua? ¿Qué tipo de problemas se pueden resolver con estas medidas y cuándo es apropiado usar uno sobre el otro? Gracias por los comentarios. Para aclarar, la pregunta surge por un interés en el análisis de iomage en lugar del...