Representados pero no representativos

La expresión que da título a la entrada procede de un escrito de Andrew Gelman. Aunque se refiere a un problema estadístico muy concreto, la he podido aplicar en otros contextos. Es uno de esos conceptos que una vez uno tropieza con él, no puede dejar de verlo en todas partes.

Gelman se refería originalmente al problema de la reponderación de las encuestas. Desafortunadamente, por muy aleatorio que sea su diseño, terminan mostrando sesgos. Por no hablar de las que se realizan en periódicos, Twitter, etc. Existen técnicas que, según la teoría, mitigan en cierta medida el problema y permiten realinear mejor o peor sus resultados con la realidad. Para ilustrar el uso de una de estas técnicas, Gelman et al. realizaron una encuesta extrema en los foros de un videojuego con el objetivo de determinar si a partir de la opinión de un conjunto de gamers, podría reconstruirse la general e ilustrar, de paso, una serie de técnicas de su autoría.

Dado que los jubilados están infrarrepresentados en esa muestra, cualquier método razonable de reponderación debería incrementar la importancia de sus opiniones en el consenso final. Cada jubilado en esa muestra representa a muchas más personas, a muchos más jubilados, que un estudiante. Utilizando una metáfora electoral, los jóvenes necesitan pocos votos para obtener un escaño muestral —es decir, un representante en la muestra—, pero los jubilados, muchísimos.

Pero el problema es que podría alegarse que aunque los jubilados están representados —por esos pocos jubilados que, contra pronóstico y por algún extraño motivo, entran en los foros de los videojuegos y acaban en la muestra—, es probable que no sean representativos del jubilado medio: por el mero hecho de acceder a esos foros se les puede presumir características especiales que no comparten con la mayoría. Representan, pero no son representativos.