Población: el padrón y la otra cosa
En un proyecto necesitábamos cifras de población por provincias durante los últimos años. Así que usamos los datos del padrón proporcionados por el INE (el INE es guay; AEMET es kk). Pero alguien nos dijo que era mejor usar los otros datos de población, los nosequé (sí, las estimaciones intercensales, si es que se llaman así) porque eran más mejores.
El padrón es un registro administrativo. Lo otro es algo soportado por lo que yo llamo método y el resto de la humanidad, metodología.
En el mundo del desempleo, pasa algo parecido: se tiene el paro registrado (registro administrativo) y EPA (encuesta). La discrepancia es del 20-25%. Tan grande que se conviene en decir simplemente que miden cosas distintas. Bueno, tratan de medir la misma cosa, pero como discrepan tanto, se recurre al subterfugio anterior.
Pero, ¿discrepan tanto el padrón y la otra cosa? ¿Tanto como la EPA y el paro registrado? ¿Más? ¿Menos? Hay una diferencia tan importante como para justificar el uso de unas u otras cifras para un uso concreto? ¿Alguien se atreve a aventurar una respuesta antes de seguir leyendo?
Para entender la situación mejor, he representado la evolución histórica del ratio entre ambas cifras (he olvidado cuál era numerador y cuál denominador) a nivel provincial y he obtenido esto:
Y eso, las diferencias son pequeñas (inferiores al 1%, lo cual es irrelevanta para las más de las aplicaciones) aunque se aprecian fenómenos insulares extraños.
No he querido pensar más sobre el asunto. Pero solicito el comodín del público: alguien que me lea conocerá los detalles y hará un enorme servicio a todos compartiendo su ciencia con los demás. Pero insisto: ciencia. Porque últimamente ha aparecido en los comentarios una horda de ocurrentes opinadores que son lo más parecido a un ruido blanco.