He visto y he disfrutado la pregunta Dar sentido al análisis de componentes principales , y ahora tengo la misma pregunta para el análisis de componentes independientes. ¿Quiero decir que quiero hacer una pregunta exhaustiva sobre las formas intuitivas de entender ICA?
Quiero entender ella. Quiero entender el propósito. Quiero sentirlo. Yo creo firmemente eso:
Realmente no entiendes algo a menos que puedas explicárselo a tu abuela.
-- Albert Einstein
Bueno, no puedo explicar este concepto a un laico o abuela
- ¿Por qué ICA? ¿Cuál era la necesidad de este concepto?
- ¿Cómo le explicarías esto a un laico?
Respuestas:
Aquí está mi intento.
Antecedentes
Considere los siguientes dos casos.
La pregunta es, en ambos casos, cómo restaurar la conversación (en 1.) o la imagen del perro (en 2.), dadas las dos imágenes que contienen las mismas "fuentes" pero con contribuciones relativas ligeramente diferentes de cada una. . ¡Seguramente mi nieto educado puede entender esto!
Solución intuitiva
¿Cómo podemos, al menos en principio, recuperar la imagen del perro de una mezcla? ¡Cada píxel contiene valores que son una suma de dos valores! Bueno, si cada píxel se proporcionara sin ningún otro píxel, nuestra intuición sería correcta: no hubiéramos podido adivinar las contribuciones relativas exactas de cada uno de los píxeles.
Sin embargo, se nos da un conjunto de píxeles (o puntos en el tiempo en el caso de la grabación), que sabemos que mantienen las mismas relaciones. Por ejemplo, si en la primera imagen, el perro siempre es dos veces más fuerte que el reflejo, y en la segunda imagen, es todo lo contrario, entonces podríamos obtener las contribuciones correctas después de todo. Y luego, podemos encontrar la forma correcta de restar las dos imágenes a la mano para que el reflejo se cancele exactamente. [Matemáticamente, esto significa encontrar la matriz de mezcla inversa.]
Zambullirse en detalles
Pero, ¿cómo puedes encontrarlo para señales generales? pueden parecer similares, tener estadísticas similares, etc. Así que supongamos que son independientes. Eso es razonable si tiene una señal interferente, como ruido, o si las dos señales son imágenes, la señal interferente puede ser un reflejo de otra cosa (y tomó dos imágenes desde diferentes ángulos).
Así que primero considere esto: si sumamos varias señales independientes, no gaussianas, hacemos que la suma sea "más gaussiana" que los componentes. ¿Por qué? debido al teorema del límite central, y también puedes pensar en la densidad de la suma de dos indep. variables, que es la convolución de las densidades. Si sumamos varias indep. Variables de Bernoulli, la distribución empírica se asemejará cada vez más a una forma gaussiana. ¿Será un verdadero gaussiano? probablemente no (sin juego de palabras), pero podemos medir la gaussianidad de una señal por la cantidad que se asemeja a una distribución gaussiana. Por ejemplo, podemos medir su exceso de curtosis. Si es realmente alto, probablemente sea menos gaussiano que uno con la misma varianza pero con un exceso de curtosis cercano a cero.
Por supuesto, esto agrega otro supuesto: para empezar, las dos señales deben ser no gaussianas.
fuente
Muy simple. Imagínese usted, su abuela y los miembros de la familia están reunidos alrededor de la mesa. Grupos más grandes de personas tienden a separarse donde el tema del chat es específico de ese subgrupo. Tu abuela se sienta allí y escucha el ruido de todas las personas que hablan, lo que parece ser solo una cacofonía. Si recurre a un grupo, puede aislar claramente las discusiones en el grupo de adolescentes / jóvenes, si recurre al otro grupo, puede aislar el chat de personas adultas.
Para resumir, ICA se trata de aislar o extraer una señal específica (una persona o un grupo de personas hablando) de una mezcla de señales (multitud hablando).
fuente