Dimensión VC de polinomios sobre semirremolques tropicales?

14

BPPPpoly ( min , + )(max,+)(min,+)

Deje ser un semired. Un patrón cero de una secuencia de polinomios en es un subconjunto para el que existen y tal que para todo , si y sólo si . Es decir, las gráficas de exactamente esos polinomios con deben alcanzar el punto . ("Patrón cero" porque la condición se puede reemplazar por ) SeaRm R [ x 1 , ... , x n ] S { 1 , ... , m } x R n y R i = 1 , ... , m f i ( x ) = y i S f i i S ( x ,(f1,,fm)mR[x1,,xn]S{1,,m}xRnyRi=1,,mfi(x)=yiSfiiS(x,y)Rn+1fi(x)=yfi(x)y=0Z(m) = el número máximo posible de patrones cero de una secuencia de polinomios de grado como máximo . Por lo tanto, . La dimensión Vapnik-Chervonenkis de los polinomios de grado es . md0Z(m)2mdVC(n,d):=max{m:Z(m)=2m}

Observación: por lo general, la dimensión VC se define para una familia F de conjuntos como la mayor cardinalidad |S|de un conjunto S de tal manera que {FS:FF}=2S . Para encajar en este marco, podemos asociar con cada par (x,y)Rn+1 el conjunto Fx,y de todos los polinomios de f grado d para los cuales mantiene. Entonces, la dimensión VC de la familia F de todos estos conjuntos F x , y es exactamente V C ( n , d ) . f(x)=yFFx,yVC(n,d)

Un límite superior trivial en es m n log | R | (necesitamos al menos 2 m de vectores distintos x R n para tener los 2 m de patrones posibles), pero es inútil en infinitas semirrelaciones. Para tener buenos límites superiores en la dimensión VC, necesitamos buenos límites superiores en Z ( m ) . Sobre los campos , tales límites son conocidos.m=VC(n,d)mnlog|R|2mxRn2mZ(m)

Teorema 1: sobre cualquier campo , tenemos Z ( m ) ( m d + nR . Z(m)(md+nn)
Milnor , Heintz y Warren probaron límites superiores similares ; Sus pruebas utilizan técnicas pesadas de geometría algebraica real. En contraste, una prueba de media página del Teorema 1 de Ronyai, Babai y Ganapathy (que damos a continuación) es una aplicación simple de álgebra lineal.

Al buscar pequeños 's satisfactorios ( m d + nm, obtenemos que VC(n,d)=O(nlogd) semantiene sobre cualquiercampo. En vista deBPPvs.P/poly, lo importante aquí es que la dimensión solo eslogarítmicaen el gradod. Esto es importante porque los circuitos de tamaño polinómico pueden calcular polinomios de grado exponencial, y porque el resultado de Haussler en el aprendizaje PAC (Corolario 2 en la página 114 de(md+nn)<2mVC(n,d)=O(nlogd)BPPPpolydeste artículo ) produce lo siguiente (donde suponemos que los circuitos deterministas pueden usar el voto mayoritario para emitir sus valores).

Teorema 2: se mantiene para los circuitos a través de cualquier semiring R , donde V C ( n , d ) sólo está polinomio en n y log d . BPPP/polyRVC(n,d)nlogd
Vea aquí cómo el resultado de Haussler implica el Teorema 2.

En particular, según el Teorema 1, mantiene sobre cualquier campo. (Lo interesante es aquí solo el caso de los campos infinitos : para los finitos, los argumentos mucho más simples funcionan: Chernoff encuadernado entonces funciona). Pero, ¿qué pasa con los semirrelaciones (infinitos) que no son campos, o incluso no son anillos? Motivado por la programación dinámica, me interesan principalmente los semirrelaciones tropicales ( max , + ) y ( min , + ) , pero también son interesantes otras semirrelaciones "no de campo" (infinitas). Tenga en cuenta que, sobre el ( maxBPPP/poly(max,+)(min,+) semiring, un polinomio f ( x ) = a A c a n i = 1 x a i i con A N y c aR , se convierte en el problema de maximización f ( x ) = max a A { c a + a 1 x 1 + a 2 x 2(max,+)f(x)=aAcai=1nxiaiANcaR ; el grado de f es (como es habitual) el máximo de un 1 + + un n sobre toda una A .f(x)=maxaA {ca+a1x1+a2x2++anxn}fa1++anaA

Pregunta: ¿Es la dimensión VC de los polinomios de grado sobre polinomios de semirremolques tropicales en n log d ? dnlogd

Lo admito, esta puede ser una pregunta bastante difícil de esperar una respuesta rápida: el álgebra tropical es bastante "loco". Pero tal vez alguien tiene algunas ideas sobre por qué (si los hay) los polinomios tropicales podrían producir más patrones cero que los polinomios reales. ¿O por qué "no deberían"? O algunas referencias relacionadas.

¿O, tal vez, la prueba de Babai, Ronyai y Ganapathy (abajo) puede ser de alguna manera "retorcida" para trabajar en semirremolques tropicales? ¿O sobre cualquier otra semirenida infinita (que no son campos)?

Prueba del teorema 1: suponga que una secuencia tiene p patrones de cero diferentes, y que v 1 , ... , v pR n sean testigos de estos patrones de cero. Sea S i = { k : f k ( v i ) 0 } un patrón cero atestiguado por el i -ésimo vector v i , y considere los polinomios g(f1,,fm)pv1,,vpRnSi={k:fk(vi)0}ivi . Afirmamos que estos polinomios son linealmente independientes sobre nuestro campo. Esta afirmación completa la prueba del teorema ya que cada g i tiene un grado como máximo D : = m d , y la dimensión del espacio de polinomios de grado como máximo D es ( n + Dgi:=kSifkgiD:=mdD . Para probar la afirmación, es suficiente tener en cuenta quegi(vj)0si y solo siSiSj. Supongamos, por el contrario, que existe una relación lineal no trivial λ1gi(x)++λpgp(x)=0. Seajun subíndice tal que| Sj| es mínimo entre losSicon(n+DD)gi(vj)0SiSjλ1gi(x)++λpgp(x)=0j|Sj|Si . Sustituye v j en la relación. Mientras que λ j g j ( v j ) 0 , tenemos λ i g i ( v j ) = 0 para todo i j , una contradicción. λi0vjλjgj(vj)0λigi(vj)=0ij

Stasys
fuente

Respuestas:

9

I've realized that the answer to my question is - yes: the VC dimension of degree d polynomials on n variables over any tropical semiring is at most a constant times n2log(n+d). This can be shown using Theorem 1 above. See here for details. So, BPP P/poly holds also for tropical circuits and, hence, also for "pure" dynamic programming algorithms.


N.B. (added 25.06.2019) In the mean time, I've resolved the problem completely in this paper. In such a generality, which I haven't even dreamed at the beginning. Tropical case is here just a very, very special case. And even more curiously: by just an appropriate combination of already know (deep in any respect) results of other authors.

What remains else to do in this (BPP vs. P/poly) direction? Besides the decrease of the size of resulting deterministic circuits (an interesting question in itself).

Stasys
fuente