Intenté algunas distribuciones y casi todas tienen varianza . Por ejemplo, tanto la distribución en la que cada coordenada de cada se elige de forma independiente y uniforme entre y la distribución en la que cada es un vector uniforme independiente en la esfera de la unidad -dimensional tiene varianza .
¿Es la varianza mínima entre todas las distribuciones?
Respuestas:
Presentaré una formulación equivalente pero más simple del problema, y mostraré un límite inferior de ( n / k - 1) / ( n −1).
También muestro una conexión a un problema abierto en la información cuántica.[Editar en la revisión 3: En revisiones anteriores, afirmé que una caracterización exacta de los casos en los que se alcanza el límite inferior que se muestra a continuación probablemente sea difícil porque una pregunta análoga en el caso complejo incluye un problema abierto sobre SIC-POVM en Información cuántica. Sin embargo, esta conexión a SIC-POVM fue incorrecta. Para obtener detalles, consulte la sección "Conexión incorrecta a SIC-POVM en la información cuántica" a continuación.]Formulación equivalente
Primero, como ya se señaló en la respuesta de daniello, tenga en cuenta que Var ( x i T x j ) = E [( x i T x j ) 2 ] - E [ x i T x j ] 2 = E [( x i T x j ) 2 ]. Entonces, en el resto de la respuesta, nos olvidamos de la varianza y en su lugar minimizamos max i ≠ j E [( x i T x j ) 2 ].
Luego, una vez que decidamos que nuestro objetivo es minimizar max i ≠ j E [( x i T x j ) 2 ], podemos ignorar la restricción de que E [ x i T x j ] = 0. Esto se debe a que si tenemos vectores unitarios x 1 ,…, x n , entonces podemos negar cada uno de ellos independientemente con probabilidad 1/2 para satisfacer E [ x i T x j ] = 0 sin cambiar el valor de la función objetivo max i ≠ j E [( x i T x j) 2 ].
Además, cambiar la función objetivo de max i ≠ j E [( x i T x j ) 2 ] a (1 / ( n ( n −1))) ∑ i ≠ j E [( x i T x j ) 2 ] No cambia el valor óptimo. El último es, como máximo, el primero porque el promedio es como máximo el máximo. Sin embargo, siempre podemos hacer los valores de E [( x i T x j ) 2 ] para diferentes opciones de ( i , j ) ( i ≠j ) igual al permutar los n vectores x 1 , ..., x n al azar.
Así que para cualquier n y k , el valor óptimo del problema en cuestión es igual al mínimo de (1 / ( n ( n -1))) Σ i ≠ j E [( x i T x j ) 2 ] donde x 1 , ..., x n son variables aleatorias que toman vectores unitarios en ℝ k como valores.
Sin embargo, por linealidad de expectativa, esta función objetivo es igual al valor esperado E [(1 / ( n ( n −1))) ∑ i ≠ j ( x i T x j ) 2 ]. Como el mínimo es como máximo el promedio, ya no es necesario considerar las distribuciones de probabilidad. Es decir, el valor óptimo del problema anterior es igual al valor óptimo de lo siguiente:
Límite inferior
Usando esta formulación equivalente, demostraremos que el valor óptimo es al menos ( n / k - 1) / ( n −1).
Para 1≤ i ≤ n , sea X i = x i x i T el proyector de rango 1 correspondiente al vector unitario x i . Luego, sostiene que ( x i T x j ) 2 = Tr ( X i X j ).
Deje Y = ∑ i X i . Luego, sostiene que ∑ i ≠ j Tr ( X i X j ) = ∑ i , j Tr ( X i X j ) - n = Tr ( Y 2 ) - n .
La desigualdad de Cauchy-Schwarz implica que Tr ( Y 2 ) ≥ (Tr Y ) 2 / k = n 2 / k , y por lo tanto ∑ i ≠ j Tr ( X i X j ) = Tr ( Y 2 ) - n ≥ n 2 / k - n . Al dividir por n ( n −1), obtenemos que el valor objetivo es al menos ( n / k - 1) / ( n −1).
En particular, cuando n = k +1, la respuesta de daniello está dentro de un factor de 2 desde el valor óptimo.
¿Cuándo es alcanzable este límite inferior?
La consecución de este límite inferior ( n / k - 1) / ( n -1) es equivalente a hacer Y = ( n / k ) I . No sé la caracterización exacta cuando es posible, pero existen las siguientes condiciones:
Aunque no he verificado los detalles, parece que cualquier diseño esférico en 2 proporciona una solución para alcanzar este límite inferior.
Conexión incorrecta a SIC-POVM en información cuántica
En revisiones anteriores, dije:
Pero esta relación era incorrecta. Explicaré por qué.
Hasta ahora, fue correcto.
Esta parte fue incorrecta. Un SIC-POVM es un conjunto de k 2 vectores unitarios x 1 ,…, x n ∈ ℂ k para los cuales | x i * x j | 2 = 1 / ( k +1) para todo i ≠ j . Tenga en cuenta que aquí el requisito debe cumplir para todos los pares i ≠ j , no solo el promedio sobre todos los pares i ≠ j . En la sección "Formulación equivalente", mostramos la equivalencia entre minimizar el máximo y minimizar el promedio, pero esto fue posible porque x 1, ..., x n eran variables aleatorias que tomaban vectores unitarios allí. Aquí x 1 , ..., x n son solo vectores unitarios, por lo que no podemos usar el mismo truco.
fuente
Por otro lado tenemosVa r [ xuna⋅ xsi] = E[ ( xuna⋅ xsi)2] ( xuna⋅ xsi)2= 1 { a , b } = { i , j } 1( k + 12) ( xuna⋅ xsi)2= 0 una si
Mi intuición es que esto es tan malo (pequeño) como se pone, pero no tengo una prueba. Más interesante es que esta construcción parece romperse para n >> k, y también cuando elXyo 's tienen que ser elegidos de forma independiente (posiblemente de diferentes distribuciones).
fuente