Matematización oscurantista

2019-5-23 (Última modificación: 2025-4-6)

Hoy he participado en una discusión en Twitter acerca del artículo Eficacia predictiva de la valoración policial del riesgo de la violencia de género que sus autores resumen así:

Para prevenir la violencia de género se desarrolló el protocolo denominado «valoración policial del riesgo» (VPR) para su uso por profesionales de las fuerzas de seguridad del Estado. Este protocolo es el núcleo principal del sistema VioGén, del Ministerio del Interior español, y que se aplica de forma reglamentaria en todas las situaciones de violencia de género denunciadas. Para evaluar la eficacia predictiva de la VPR se realizó un estudio longitudinal prospectivo con un seguimiento de 3 y 6 meses de 407 mujeres que habían denunciado ser víctimas de violencia por parte de su pareja o expareja. Los resultados obtenidos por medio del análisis de regresión logística ofrecen una AUC = 0.71 para intervalos de tiempo en riesgo de 3 meses (p < .003) y con una odds ratio de 6.58 (IC 95%: 1.899-22.835). La sensibilidad de la VPR fue del 85% y la especificidad, del 53.7%. Los resultados indican que la VPR muestra una buena capacidad predictiva y unas características psicométricas adecuadas para la tarea para la que se diseñó.

En el artículo aprendemos que el protocolo VPR es una especie de modelo que asigna a cada caso una valoración de riesgo de agresión en una escala de 5 niveles: «no se da», «baja», «media», «alta» y «extrema».

Para evaluarlo se han tomado 407 casos que se han seguido en el tiempo, al cabo del cual se han registrado 20 denuncias.

El resto del artículo es un ejercicio de matematización oscurantista para describirnos la batalla con tanto lujo de detalles que no podamos entender si acabó en victoria o derrota.

Cosas que echo de menos:

La primera, para cada nivel de riesgo, el número de casos totales, el número de denuncias, la probabilidad esperada y sus intervalos de confianza. ¿Crecen esas probabilidades con el nivel de riesgo? Ni lo cuentan ni lo sabemos. ¿Son razonables el número de observaciones en cada nivel de riesgo? Ni lo cuentan ni lo sabemos.
Una explicación de por qué el modelo existe en lugar de no existir: ¿qué tipo de problema operativo resuelve? ¿Permite optimizar la asignación de recursos de algún modo? ¿Lo hace eficazmente? ¿Vale, en definitiva, para algo?

Acerca del primer punto, lo que sí que se hace en el artículo es agregar los cinco niveles en dos. Dos y no tres. Cortando por un punto y no por otro. ¿Por qué no malpensar que esas decisiones se tomaron para que los resultados resultasen más fotogénicos? Yo creo que los autores retuercen el hilo de la metodología para arrimar el ascua a su sardina. Y que el hecho de que no muestren la información que uno más naturalmente pediría significa, probablemente, que tienen un montón de basura debajo de la alfombra.

Por lo demás, sí, han transcrito muy correctitamente los estadísticos que SPSS en su vigésima versión ofrece a quien aprendió a navegar sus vericuetosos menúes.

Nota: Uso prestado en el título de esta entrada nomenclatura de Gustavo Bueno. Las matemáticas y la estadística, al igual que los mitos, pueden ser utilizadas para aclarar e iluminar, pero también para confundir y oscurecer.