Estoy haciendo el curso Stanford de Machine Learning en Coursera.
En el capítulo sobre Regresión logística, la función de costo es esta:
Intenté obtener la derivada de la función de costo, pero obtuve algo completamente diferente.
¿Cómo se obtiene la derivada?
¿Cuáles son los pasos intermedios?
regression
logistic
gradient-descent
derivative
octaviano
fuente
fuente
Respuestas:
Adaptado de las notas del curso, que no veo disponibles (incluida esta derivación) fuera de las notas aportadas por los estudiantes dentro de la página del curso Coursera Machine Learning de Andrew Ng .
En lo que sigue, el superíndice denota mediciones individuales o "ejemplos" de entrenamiento.(i)
La derivada de la función sigmoidea es
fuente
Para evitar la impresión de una complejidad excesiva del asunto, veamos la estructura de la solución.
Con la simplificación y el abuso de la notación, dejemos que sea un término en suma de , y es una función de :G(θ) J(θ) h=1/(1+e−z) z(θ)=xθ
Podemos usar la regla de la cadena: y resolverlo uno por uno ( e son constantes).dGdθ=dGdhdhdzdzdθ x y
Finalmente, .dzdθ=x
La combinación de los resultados en conjunto da la expresión buscada: Espero que ayude.
fuente
El crédito por esta respuesta es para Antoni Parellada de los comentarios, que creo que merece un lugar más destacado en esta página (ya que me ayudó cuando muchas otras respuestas no lo hicieron). Además, esta no es una derivación completa, sino más bien una declaración clara de . (Para obtener una derivación completa, consulte las otras respuestas).∂J(θ)∂θ
dónde
Además, una implementación de Python para aquellos que desean calcular el gradiente de con respecto a .J θ
fuente
Para aquellos de nosotros que no somos tan fuertes en el cálculo, pero nos gustaría jugar con el ajuste de la función de costos y necesitamos encontrar una forma de calcular derivados ... un atajo para volver a aprender el cálculo es esta herramienta en línea que proporciona automáticamente la derivación, con explicaciones paso a paso de la regla.
https://www.derivative-calculator.net
fuente