Ine

Mucho ha cambiado en 20 años (menos el número de taxis)

Muchas cosas han cambiado en los últimos 20 años. De hecho, acaba de hacer 20 años desde la primera vez que me conecté a internet y que tuve una cuenta de correo electrónico.

Sin embargo,

taxis_espana

(Las cifras anteriores corresponden a taxis de las capitales de provincia; hay datos para otras en el INE).

Incidentalmente, hoy se han manifestado taxistas de toda España en Madrid para exigir protección para el sector.

El curioso caso de los suicidios en la villa de Madrid

Esta entrada es la continuación de otra casi homónima, El curioso caso de los suicidios en Madrid. Los datos de aquella ocasión eran dos cosas: raros y provinciales. Los de esta son otras dos: mucho más raros y muncipales. En efecto,

suicidios_municipio_madrid

¡Ni jarto de vino!

Y, ahora, las notas:

  1. Los datos de causa de muerte a nivel municipal no son públicos pero se pueden solicitar al INE. De hecho, es el INE la fuente primaria de los datos del gráfico.
  2. La secundaria es un documental de EL Español sobre los suicidios. Mañana comentaré por qué aparezco en sus agradecimientos, aunque tal vez alguien lo pueda adivinar hoy.

El curioso caso de los suicidios en Madrid

Uno de esos descubrimientos del XIX fue que, mientras que los seres humanos tenemos (cierta) libertad de acción, en agrupaciones humanas amplias de distintos lugares y fechas existían ciertas regularidades en números tales como la tasa de suicidio.

Hoy he tenido acceso a datos que el INE no publica: número de suicidios por municipio (mayor de 10000 habitantes) y los que corresponden a la ciudad de Madrid son increíbles. No los tengo, pero sí los de la provincia (que sí que publica el INE):

Rapapolvos al INE

¿Os acordáis de cuando escribí que para ingresar en el INE solo hacía falta estadística viejuna? Pues me cuenta una fuente fidedigna que Eurostat ha realizado una auditoría a nuestro organismo estadístico de cabecera y que le ha caído un buen rapapolvos. Consecuencia del cual, el INE está reformulando los criterios de acceso y tratándose de poner al día.

Igual no es cierto. No soy ducho en eso de manejar fuentes y hablar por terceros, sean o parezcan fidedignos o no. Tal vez me han metido un gol. Mas se non è vero, è ben trovato. Y si lo es, lo sabremos pronto.

La encuesta de presupuestos familiares, en MicroDatosEs

R

Hoy he subido una nueva versión del paquete MicroDatosEs a r-forge que incluye herramientas para cargar los datos de la Encuesta de Presupuestos Familiares.

Aún no está en CRAN, pero estáis invitados a probarla instalando la versión de desarrollo mediante

install.packages("MicroDatosEs", repos="http://R-Forge.R-project.org")

La parte del paquete que se encarga de la EPF es obra de Diego Paniagua, que es uno de los estudiantes del Experto en Data Science de la UTAD. La aportación a este paquete es, de hecho, parte de su proyecto final.

Petición al INE: deseadme suerte

Acabo de realizar (día 2015-04-27) la siguiente petición (autoexplicativa) al INE:

Estimados señores:

En sus páginas pueden descargarse los “Mapas municipales” para ser utilizados conjuntamente con el programa PC-Axis para visualizar datos estadísticos. Junto con los mapas aparecen unos ficheros, p.e., “Mapas a 01-01-2004.txt” en los que se indica que:

“El usuario no está autorizado a redistribuir estos archivos sin previa autorización del INE, lo que ha aceptado al proceder a su instalación.”

¿13.100 más/menos cuántos parados menos?

¿Cuál es la cifra de variación del número de parados de la que hablan la última EPA y los medios? 13100.

¿Más menos cuánto? Según el INE, el error de muestreo relativo, $latex \sqrt{V(\hat{\sigma}}$ a nivel nacional en términos porcentuales es

error_relativo

Es decir, el intervalo de confianza para la cifra de parados tendría una anchura como de 100k sujetos. Obviamente, eso impide calcular variaciones de un orden de magnitud menor.

Datos, datos, datos,... ¿pero qué datos?

Porque según donde mira uno… Veamos un ejemplo. Ha caído en mi mano este documento de Eurostat sobre residuos urbanos y su reciclaje (o no).

Lo primero que me ha llamado la atención han sido los números correspondientes a España:

residuos_urbanos

¿A vosotros no? Qué números tan redondos, ¿verdad? Como si puestos a ojo. Pues sí, son, poco más o menos, a ojo. La tabla tiene una nota en letra diminuta en la que indica que las cifras de España (y algunos otros países) son estimaciones que podrían ser revisadas.

Unas preguntas incómodas

Que la mujer promedio gana menos que el hombre promedio es un hecho conocido. A los usuarios de R que estén al tanto de mi paquete MicroDatosEs no hace falta siquiera que se lo cuenten: pueden bajar los datos de la Encuesta de Estructura Salarial del INE y hacer el cálculo por sí mismos.

Que las mujeres ganen menos en promedio aun teniendo en cuenta las variables recogidas en dicha encuesta (nivel de formación, antigüedad en el puesto de trabajo, etc.) es también un hecho. Los usuarios de R también pueden crear un modelo descriptivo: el fenómeno se manifiesta claramente. O pueden (sepan o no R) leer cualquiera de los informes publicados al respecto para llegar a la misma conclusión.

Movilidad municipal

Esto que cuento hoy es algo que, creo yo, pocos saben. Pero que han sufrido grandemente quienes hayan trabajando con datos municipales históricos: que de año en año, ocurren altas, bajas y modificaciones en esa lista que uno consideraría fija.

Aquí (y más concretamente aquí) puede consultarse la lista de las modificaciones en el mapa municipal en lo que llevamos de 2015. A través de los menús del primer enlace uno puede navegar hasta los cambios ocurridos en años anteriores.

Proyecciones, estimaciones, previsiones, operaciones... y churros

¿Os acordáis de lo de las proyecciones de población a largo plazo del INE? Atentos a lo que dice el instituto sobre ellas aquí (en la sección de acuracidad):

La elaboración de esta operación no está basada en una estimación estocástica de la evolución demográfica futura. En rigor, sus resultados no deben considerarse como una estimación del futuro, ni siquiera como una previsión. No cabe, por tanto, hablar de precisión o acuracidad de los mismos.

¿Y si no se mantuvieran?

Comienzo mi entrada de hoy con una foto de Madrid en la nochevieja de 1964.

almacenes-arias_anos-601

Esta es otra de los hinchas del equipo nacional el mismo año en los prolegómenos de la final de la Eurocopa del mismo año, que le ganamos a la Unión Soviética.

espana_urss

Aquí encontrarán mis lectores otras escenas de lo que era costumbre en aquellas fechas de hace cincuenta años.

Y no, no quiero reconvertir mi bitácora en otras Escenas Matritenses. Solo quiero advertir que tal vez alguno de los que aparecen en esas fotos trabajaban en el INE de antaño y recibió uno de esos días que se retratan el encargo de predecir la evolución de la población española hasta la actualidad. A ese señor, sin barruntar siquiera el Franco ha muerto; el se sienten, coño; el a este país no lo va a conocer ni la madre que lo parió; el nosotras parimos, nosotras decidimos; el váyase Sr. González; el España va bien; ni, vamos, la famélica legión del Gurugú, le habría tocado armarse de escuadra y cartabón y proyectar rectas de tinta china con tiralíneas hasta el mismo día de hoy para contarnos algo que sabemos mucho mejor que él: cuántos españolitos somos ahora.

¿Tienen sentido las tasas municipales de desempleo?

Sigo los artículos de periodismo de datos de El Confidencial. Los recomiendo, de hecho. Es bueno que alguien se encargue de divulgar noticias que tienen que ver con números.

Y ahora llega el pero. Una parte —y sus autores la consideran importante porque la elevan al titular— de lo que se discute en Nueve de cada diez municipios tienen más paro ahora que antes de comenzar la crisis es amarillismo numérico. Que quiero pensar que involuntario. El nivel municipal, y más habida cuenta del micromunicipalismo español, es demasiado fino para capturar algo que no sea ruido.