Científicos de datos, aprended de los actuarios
Los actuarios fueron tal vez los primeros científicos de datos. Aparentemente, la primera tabla de mortalidad fue creada por John Graunt en 1662.
Los actuarios hablan de la esperanza de vida. Pero no son tan pendejos como los científicos de datos de hoy en día en eso de pretender que la esperanza de vida es la vida. Los actuarios saben que en una cohorte con una esperanza de vida de 78 años habrá quien muera a los tres, a los quince, a los cincuenta y a los noventa. Nadie les exige que acierten cuándo va a morir cada cual. En lugar de eso, estudian la distribución de los fallecimientos a lo largo del tiempo y calculan indicadores útiles para sus clientes.
Yo creo que ningún actuario sabe qué es el RMSE. Ni falta le hace.
Muchos científicos de datos, igual que los actuarios, trabajan con datos que se refieren a personas: cuánto tardarán mis clientes en volver a entrar por la puerta, cuánto comprarán en los próximos meses, etc. Pero la ciencia de los datos, mucho más reciente que la actuarial, peca del ímpetu y la fogosidad propia de los jóvenes y aspira a acertar individuo por individuo cuánto y cuándo. ¡Ay si no!
La ciencia de los datos madurará y se volverá más como la actuarial. Los científicos de datos tienen, tenemos, mucho que aprender de los actuarios. Entre otras cosas, tenemos que sacudirnos de encima el fetichismo de la precisión. Tenemos que asumir que los seres humanos cuyo comportamiento aspiramos predecir, gozan de albedrío y están sujetos a circunstancias que nuestros modelos de diez variables y siete parámetros no recogen.
Tenemos, en definitiva, dejar de llamar errores a las desviaciones con respecto a nuestras predicciones, asumirlas como fluctuaciones naturales y, como los actuarios, elaborar sobre ellas.