¿Por qué el optimizador de una red neuronal no se va al carajo (como suelen L-BFGS-B y similares)?
Vale, admito que no funciona siempre. Pero una manera de distinguir a un matemático de un ingeniero es por una casi imperceptible pausa que los primeros realizan antes de pronunciar optimización. Un matemático nunca conjuga el verbo optimizar en vano.
[Una vez, hace tiempo, movido por una mezcla de paternalismo y maldad, delegué un subproblema que incluía el fatídico optim
de R en una ingeniera. Aún le debe doler el asunto.]