¿Se puede predecir con Twitter?
Tal y como quedaron establecidos hace 80 años los parámetros para determinar si una hipótesis es o no plausible —por no calificarla de significativa o, más malévolamente, publicable—solo una de cada veinte lo serían.
Es un hecho que contrasta con la habilidad de los consultores que se dedican a esa labor tan difícil de acotar y que va desde la estadística a la minería de datos tocando otras áreas más o menos afines. Los buenos, siempre encuentran efectos significativísimos y relevantísimos con que adornar sus presentaciones. So pena de ser sustituidos por otros con todavía menos escrúpulos que sepan envolver con maña en pan de oro el accidente y la aleatoriedad.
Análogamente, una miríada de publicaciones sobre Twitter han contribuido a crear una especie de halo casi místico alrededor de dicho servicio de microblogs: dizque permite tomar el pulso a la sociedad hasta el punto de permitir predecir, entre otros, resultados electorales.
Por eso es refrescante leer artículos como I Wanted to Predict Elections with Twitter and all I got was this Lousy Paper de Daniel Gayo Abello, que ofrece una crítica razonada de la, por así llamarla, literatura optimista.
En resumen:
- No todo el mundo está en Twitter, por lo que las conclusiones que se obtengan a partir de él tienen un sesgo geográfico y demográfico. La gente, de hecho, lleva décadas escribiendo libros sobre muestreo por algún motivo.
- Ni siquiera todo el mundo escribe sobre política (relevante a la hora de predecir elecciones) en su cuenta de Twitter.
- No todo lo que aparece en Twitter es verdad: hay contenido generado por robots, cuentas falsas, etc. que puede sesgar los estudios.
- Desentrañar el significado de un mensaje no es sencillo para una máquina cuando este está envuelto en sarcasmo, encierra juegos de palabras, etc.