Factorización matricial con nulos

In illo tempore me llamaba mucho la atención encontrar métodos de ciencia de datos basados en factorización de matrices cuando la matriz a factorizar tenía nulos. Ocurre, por ejemplo, en sistemas de recomendación (cuando un usuario no ha visto o no nos ha dicho si le gusta determinada película).

Y claro, con un nulo en la cosa, te comes los apuntes de álgebra lineal con papas.

¿Cómo se hace? Si buscas $U$ y $V$ tales que $Y = UV^\prime$:

  • Consideras los valores de $U$ y $V$ variables desconocidas.
  • Buscas minimizar (deslizándote por el tobogán del gradiente, por ejemplo) la suma de los términos $\left(y_{ij} - \sum_k u_{ik} v_{jk}\right)^2$ donde $y_{ij}$ no es nulo.

No es lo que nos contaron en álgebra de primero, pero funciona y escala.

Más detalles, aquí.