Existe una teoría de aproximación estándar donde la relación de aproximación es (para problemas conobjetivos),- el valor devuelto por algún algoritmoy- un valor óptimo. Y otra teoría, la deaproximación diferencialdonde la relación de aproximación es ,- el peor valor de una solución factible para la instancia dada. Losautoresde esta teoría afirman que tiene algunas ventajas definidas sobre la clásica. Por ejemplo:
- proporciona la misma relación de aproximación para problemas tales como cobertura de vértice mínima y conjunto independiente máximo que se sabe que son solo diferentes realizaciones del mismo problema;
- da la misma proporción para las versiones máxima y mínima del mismo problema. Al mismo tiempo, sabemos en teoría estándar que MIN TSP y MAX TSP tienen relaciones muy diferentes.
- Mide la distancia no solo al óptimo sino también al pesario . Entonces, en el caso de Vertex Cover, la teoría de aproximación estándar dice que es el mejor límite superior. Pero essentialy es la relación máxima entre el pesario y el óptimo. Por lo tanto, se garantiza que dicho algoritmo generará la solución con el peor valor.2 2
Mi argumento a favor es: en el análisis asintótico no tomamos en consideración las constantes y los términos de bajo orden (aquí recordé la cita de Avi Widgerson: "Tenemos éxito porque usamos el nivel correcto de abstracción") y este es el nivel de abstracción para comparar el uso de recursos del algoritmo. Pero cuando estudiamos la aproximación, por alguna razón, introducimos la diferencia en aquellos lugares donde podemos evitarla.
Mi pregunta es
¿Por qué la teoría de aproximación diferencial tan poco estudiada? ¿O los argumentos involucrados no son lo suficientemente fuertes?
fuente
Respuestas:
Hay dos interpretaciones de la afirmación "el algoritmo encuentra una aproximación α del problema P "A α P :
Creo que la definición clásica del factor de aproximación enfatiza la primera interpretación. Clasificamos los problemas de acuerdo con su facilidad de resolución.
La relación de aproximación diferencial parece poner un poco más de peso en la segunda interpretación: no queremos "recompensar" algoritmos triviales (por ejemplo, algoritmos que solo generan un conjunto vacío o el conjunto de todos los nodos).
Por supuesto, ambos son puntos de vista válidos, pero son puntos de vista diferentes .
También podemos estudiar la pregunta desde una perspectiva un poco más práctica. Desafortunadamente, las cubiertas de vértices como tales no tienen tantos usos directos, pero por razones de argumento, consideremos estas dos aplicaciones (algo artificiales):
Cubierta del vértice: los nodos son computadoras y los bordes son enlaces de comunicación; queremos monitorear todos los enlaces de comunicación y, por lo tanto, al menos un punto final de cada borde debe ejecutar un proceso especial.
Conjunto independiente: los nodos son trabajadores y los conflictos del modelo de bordes entre sus actividades; queremos encontrar un conjunto de actividades sin conflictos que se puedan realizar simultáneamente.
Ahora ambos problemas tienen una solución trivial: el conjunto de todos los nodos es una cubierta de vértice, y el conjunto vacío es un conjunto independiente.
La diferencia clave es que con el problema de la cubierta de vértices, la solución trivial hace el trabajo . Claro, estamos usando más recursos de los necesarios, pero al menos tenemos una solución que podemos usar en la práctica. Sin embargo, con el problema del conjunto independiente, la solución trivial es completamente inútil . No estamos progresando en absoluto. Nadie esta haciendo nada. La tarea nunca se completa.
Del mismo modo, podemos comparar soluciones casi triviales: vértice cubierta , que consiste en los extremos de un acoplamiento máximo, y el conjunto independiente I que es el complemento de C . Nuevamente, C ciertamente hace el trabajo en nuestra aplicación, y esta vez no estamos desperdiciando recursos en más del factor dos. Sin embargo, yo podría volver a ser un conjunto vacío, que es completamente inútil.C I C C I
Por lo tanto, la definición estándar de la garantía de aproximación nos dice directamente si la solución es útil o no. Una aproximación de 2 de la cubierta del vértice hace el trabajo. Un conjunto independiente sin ninguna garantía de aproximación podría ser completamente inútil.
En cierto sentido, la relación de aproximación diferencial intenta medir "cuán no trivial" es la solución, pero ¿importa en alguna de estas aplicaciones? (¿Importa en alguna aplicación?)
fuente
No estoy familiarizado con la noción de aproximación diferencial, y no tengo ninguna teoría de por qué no está bien estudiada. Sin embargo, me gustaría señalar que no siempre es deseable describir el rendimiento de un algoritmo de aproximación con una sola medida. En este sentido, me resulta difícil aceptar que alguna medida sea mejor que otra.
Por ejemplo, como usted indicó, la cobertura mínima de vértice admite un algoritmo de aproximación 2 de tiempo polinómico, mientras que es difícil de NP aproximar el conjunto independiente máximo a cualquier relación constante. Aunque entiendo que esto puede ser sorprendente a primera vista, tiene un significado legítimo: (1) la cobertura mínima de vértice se puede aproximar bien cuando es pequeña pero (2) no se puede aproximar bien cuando es grande. Cuando afirmamos que es NP-difícil aproximar la cobertura mínima del vértice (y el conjunto independiente máximo) con cualquier relación de aproximación diferencial constante positiva, estamos ignorando efectivamente la propiedad (1). Probablemente sea lo suficientemente bueno para algunos propósitos ignorar la propiedad (1), pero ciertamente no siempre es así.
Tenga en cuenta que no siempre usamos la relación de aproximación para describir el rendimiento de los algoritmos de aproximación. Por ejemplo, para establecer un resultado de inaproximabilidad basado en el teorema de PCP en toda su generalidad, necesitamos la formulación basada en problemas de brecha. Vea mi respuesta a otra pregunta para más detalles. En este caso, ni usar la relación de aproximación estándar ni usar la relación de aproximación diferencial nos permite establecer el resultado en la generalidad completa.
fuente
Como señala Tsuyoshi, el problema podría ser para qué tipo de argumento desea utilizar el límite obtenido. A continuación, intentaré desarrollar dos motivaciones diferentes.
Relaciones diferenciales de la formaα=Ω−AΩ−OPT α⋅100%
Por lo tanto, dependiendo de qué tipo de declaración respalde el límite derivado, debe elegir la alternativa adecuada.
fuente