Ine

Mucho ha cambiado en 20 años (menos el número de taxis)

Muchas cosas han cambiado en los últimos 20 años. De hecho, acaba de hacer 20 años desde la primera vez que me conecté a internet y que tuve una cuenta de correo electrónico. Sin embargo, (Las cifras anteriores corresponden a taxis de las capitales de provincia; hay datos para otras en el INE). Incidentalmente, hoy se han manifestado taxistas de toda España en Madrid para exigir protección para el sector.

El curioso caso de los suicidios en la villa de Madrid

Esta entrada es la continuación de otra casi homónima, El curioso caso de los suicidios en Madrid. Los datos de aquella ocasión eran dos cosas: raros y provinciales. Los de esta son otras dos: mucho más raros y muncipales. En efecto, ¡Ni jarto de vino! Y, ahora, las notas: Los datos de causa de muerte a nivel municipal no son públicos pero se pueden solicitar al INE. De hecho, es el INE la fuente primaria de los datos del gráfico.

El curioso caso de los suicidios en Madrid

Uno de esos descubrimientos del XIX fue que, mientras que los seres humanos tenemos (cierta) libertad de acción, en agrupaciones humanas amplias de distintos lugares y fechas existían ciertas regularidades en números tales como la tasa de suicidio. Hoy he tenido acceso a datos que el INE no publica: número de suicidios por municipio (mayor de 10000 habitantes) y los que corresponden a la ciudad de Madrid son increíbles. No los tengo, pero sí los de la provincia (que sí que publica el INE):

Rapapolvos al INE

¿Os acordáis de cuando escribí que para ingresar en el INE solo hacía falta estadística viejuna? Pues me cuenta una fuente fidedigna que Eurostat ha realizado una auditoría a nuestro organismo estadístico de cabecera y que le ha caído un buen rapapolvos. Consecuencia del cual, el INE está reformulando los criterios de acceso y tratándose de poner al día. Igual no es cierto. No soy ducho en eso de manejar fuentes y hablar por terceros, sean o parezcan fidedignos o no.

La encuesta de presupuestos familiares, en MicroDatosEs

R
Hoy he subido una nueva versión del paquete MicroDatosEs a r-forge que incluye herramientas para cargar los datos de la Encuesta de Presupuestos Familiares. Aún no está en CRAN, pero estáis invitados a probarla instalando la versión de desarrollo mediante install.packages("MicroDatosEs", repos="http://R-Forge.R-project.org") La parte del paquete que se encarga de la EPF es obra de Diego Paniagua, que es uno de los estudiantes del Experto en Data Science de la UTAD.

Petición al INE: deseadme suerte

Acabo de realizar (día 2015-04-27) la siguiente petición (autoexplicativa) al INE: Estimados señores: En sus páginas pueden descargarse los “Mapas municipales” para ser utilizados conjuntamente con el programa PC-Axis para visualizar datos estadísticos. Junto con los mapas aparecen unos ficheros, p.e., “Mapas a 01-01-2004.txt” en los que se indica que: “El usuario no está autorizado a redistribuir estos archivos sin previa autorización del INE, lo que ha aceptado al proceder a su instalación.

¿13.100 más/menos cuántos parados menos?

¿Cuál es la cifra de variación del número de parados de la que hablan la última EPA y los medios? 13100. ¿Más menos cuánto? Según el INE, el error de muestreo relativo, $latex \sqrt{V(\hat{\sigma}}$ a nivel nacional en términos porcentuales es Es decir, el intervalo de confianza para la cifra de parados tendría una anchura como de 100k sujetos. Obviamente, eso impide calcular variaciones de un orden de magnitud menor.

Datos, datos, datos,... ¿pero qué datos?

Porque según donde mira uno… Veamos un ejemplo. Ha caído en mi mano este documento de Eurostat sobre residuos urbanos y su reciclaje (o no). Lo primero que me ha llamado la atención han sido los números correspondientes a España: ¿A vosotros no? Qué números tan redondos, ¿verdad? Como si puestos a ojo. Pues sí, son, poco más o menos, a ojo. La tabla tiene una nota en letra diminuta en la que indica que las cifras de España (y algunos otros países) son estimaciones que podrían ser revisadas.

Unas preguntas incómodas

Que la mujer promedio gana menos que el hombre promedio es un hecho conocido. A los usuarios de R que estén al tanto de mi paquete MicroDatosEs no hace falta siquiera que se lo cuenten: pueden bajar los datos de la Encuesta de Estructura Salarial del INE y hacer el cálculo por sí mismos. Que las mujeres ganen menos en promedio aun teniendo en cuenta las variables recogidas en dicha encuesta (nivel de formación, antigüedad en el puesto de trabajo, etc.

Movilidad municipal

Esto que cuento hoy es algo que, creo yo, pocos saben. Pero que han sufrido grandemente quienes hayan trabajando con datos municipales históricos: que de año en año, ocurren altas, bajas y modificaciones en esa lista que uno consideraría fija. Aquí (y más concretamente aquí) puede consultarse la lista de las modificaciones en el mapa municipal en lo que llevamos de 2015. A través de los menús del primer enlace uno puede navegar hasta los cambios ocurridos en años anteriores.

Proyecciones, estimaciones, previsiones, operaciones... y churros

¿Os acordáis de lo de las proyecciones de población a largo plazo del INE? Atentos a lo que dice el instituto sobre ellas aquí (en la sección de acuracidad): La elaboración de esta operación no está basada en una estimación estocástica de la evolución demográfica futura. En rigor, sus resultados no deben considerarse como una estimación del futuro, ni siquiera como una previsión. No cabe, por tanto, hablar de precisión o acuracidad de los mismos.

¿Y si no se mantuvieran?

Comienzo mi entrada de hoy con una foto de Madrid en la nochevieja de 1964. Esta es otra de los hinchas del equipo nacional el mismo año en los prolegómenos de la final de la Eurocopa del mismo año, que le ganamos a la Unión Soviética. Aquí encontrarán mis lectores otras escenas de lo que era costumbre en aquellas fechas de hace cincuenta años. Y no, no quiero reconvertir mi bitácora en otras Escenas Matritenses.

¿Tienen sentido las tasas municipales de desempleo?

Sigo los artículos de periodismo de datos de El Confidencial. Los recomiendo, de hecho. Es bueno que alguien se encargue de divulgar noticias que tienen que ver con números. Y ahora llega el pero. Una parte —y sus autores la consideran importante porque la elevan al titular— de lo que se discute en Nueve de cada diez municipios tienen más paro ahora que antes de comenzar la crisis es amarillismo numérico.