Tengo un conjunto de datos y quiero encontrar el parámetro manera que minimice la suma
es decir
optimization
convex-optimization
mayenew
fuente
fuente
Respuestas:
¿Probablemente pides una prueba de que la mediana resuelve el problema? Bueno, esto se puede hacer así:
El objetivo es lineal por partes y, por lo tanto, diferenciable, excepto para los puntos . ¿Cuál es la pendiente del objetivo en algún punto m ≠ x i ? Bueno, la pendiente es la suma de las pendientes de los mapeos m ↦ | m - x j | y esto es + 1 (para m > x j ) o - 1 (para m < x j ). Por lo tanto, la pendiente indica cuántosm=xi m≠xi m↦|m−xj| +1 m>xj −1 m<xj son más pequeñas que mxi m . Usted ve que la pendiente es cero si hay igualmente muchos más pequeños y más grandes que m (para un número par de x i ). Si hay un número impar de x i 's, entonces la pendiente es - 1 a la izquierda del "medio" y + 1 a la derecha, por lo tanto, el medio es el mínimo.xi m xi xi −1 +1
fuente
Una generalización de este problema a múltiples dimensiones se llama problema geométrico mediano . Como señala David, la mediana es la solución para el caso 1-D; allí, podría usar algoritmos de selección de búsqueda de mediana , que son más eficientes que la clasificación. Los tipos son mientras que los algoritmos de selección son O (O(nlogn) ; las clasificaciones solo son más eficientes si se necesitan selecciones múltiples, en cuyo caso podría ordenar (costosamente) una vez y luego seleccionar repetidamente de la lista ordenada.O(n)
El enlace al problema de la mediana geométrica menciona soluciones para casos multidimensionales.
fuente
La solución explícita en términos de la mediana es correcta, pero en respuesta a un comentario de mayenew, aquí hay otro enfoque.
Es bien sabido queℓ1 problemas de minimización de general, y el problema publicado en particular, pueden resolverse mediante programación lineal.
La siguiente formulación LP servirá para el ejercicio dado con incógnitas :zi,m
tal que: z i ≥ m - x i z i ≥ x i - m
Claramente debe ser igual a | x i - m | como mínimo, por lo que pide que se minimice la suma de los valores absolutos de los errores.zi |xi−m|
fuente
La forma de análisis convexo sobrecargada para mostrar esto es solo tomar subgraduados. De hecho, esto es equivalente al razonamiento utilizado en algunas de las otras respuestas que involucran pendientes.
El problema de optimización es convexo (porque el objetivo es convexo y no hay restricciones). Además, el subgradiente de es|m−xi|
-1 sim<xi
[-1,1] sim=xi
+1 si .m>xi
Dado que una función convexa se minimiza si y solo si su subgradiente contiene cero, y el subgradiente de una suma de funciones convexas es la suma (establecida) de los subgradientes, obtienes que 0 está en el subgradiente si y solo si es la mediana de x 1 , ... x k .m x1,…xk
fuente
Básicamente estamos detrás de:
Uno debería notar que la
median
de un grupo discreto no está definida de manera única.Además, no es necesariamente un elemento dentro del grupo.
fuente