Cuando oigáis que los algoritmos discriminan, acordaos de esto que cuento hoy
Generalmente, cuando construyes uno de esos modelos para clasificar gente entre merecedores de una hipoteca o no; de un descuento o no; de… vamos, lo que hacen cientos de científicos de datos a diario, se utilizan dos tipos de fuentes de datos: individuales y grupales.
La información grupal es la que se atribuye a un individuo por el hecho de pertenecer a un sexo, a un grupo de edad, a un código postal, etc. Típicamente tiene una estructura seccional (invariante en el tiempo).
La individual es producto de su propio comportamiento: histórico de transacciones, antecedentes penales, registros médicos, etc. Típicamente, es longitudinal.
Construir modelos consiste en combinar esos dos tipos de fuentes de información para poder realizar predicciones sobre los sujetos en cuestión. No entraré en detalles sobre cómo.
Ahora vienen los raritos. Y me refiero a estos:
Que van y dicen que:
Así que, ¿qué cojones querrán los raritos?