Explicación de los scorings de "ciertos" modelos
Esta entrada la hago por petición popular y para rematar de alguna manera lo que incoé hace unos días. Seré breve hasta lo telegráfico:
- Tomo las observaciones con scorings más altos (en un árbol construido con
ranger
y cariño). - Veo cuáles son los árboles que les asignan scorings más altos.
- Anoto las variables implicadas en las ramas por donde bajan las observaciones (1) en los árboles (2).
- Creo una matriz positiva: filas = casos, columnas = variables, valores = conteos.
- Y la descompongo (vía NMF). 6. Etc.
Es hasta paquetizable.