Ine

¿Seguro que aplica lo del secreto estadístico?

[A esta entrada, publicada hace un tiempo y puede que con más entusiasmo que reflexión, le he añadido posteriormente, en junio de 2022, una coda con cosas que he aprendido luego.]

En la nota de prensa de la estadística de transporte de viajeros del INE de julio de 2016 (no la enlazo porque, entiendo, las notas de prensa van siendo reemplazadas en su portal) aparece la tabla

transporte_viajeros

en la que el lector podrá encontrar valores ocultos con un puntero a la nota al pie. Que dice:

PIB y progreso: ¿mide lo que debe medir?

Anoche me busqué a mí mismo en el Registro Mercantil. Sudé la gota gorda y cuando me encontré, es decir, recibí una notificación de que mis registros habían sido ubicados por el buscador, me apareció una aviso: si quería proceder a ver los resultados de la búsqueda tenía que abonar 1.78 euros (creo).

Así que si pierdo 20 minutos de mi vida en una seudopágina que me quiere cobrar casi dos euros por información que yo le he proporcionado, el PIB español crece en 1.78 euros.

Mucho ha cambiado en 20 años (menos el número de taxis)

Muchas cosas han cambiado en los últimos 20 años. De hecho, acaba de hacer 20 años desde la primera vez que me conecté a internet y que tuve una cuenta de correo electrónico.

Sin embargo,

taxis_espana

(Las cifras anteriores corresponden a taxis de las capitales de provincia; hay datos para otras en el INE).

Incidentalmente, hoy se han manifestado taxistas de toda España en Madrid para exigir protección para el sector.

El curioso caso de los suicidios en la villa de Madrid

Esta entrada es la continuación de otra casi homónima, El curioso caso de los suicidios en Madrid. Los datos de aquella ocasión eran dos cosas: raros y provinciales. Los de esta son otras dos: mucho más raros y muncipales. En efecto,

suicidios_municipio_madrid

¡Ni jarto de vino!

Y, ahora, las notas:

  1. Los datos de causa de muerte a nivel municipal no son públicos pero se pueden solicitar al INE. De hecho, es el INE la fuente primaria de los datos del gráfico.
  2. La secundaria es un documental de EL Español sobre los suicidios. Mañana comentaré por qué aparezco en sus agradecimientos, aunque tal vez alguien lo pueda adivinar hoy.

El curioso caso de los suicidios en Madrid

Uno de esos descubrimientos del XIX fue que, mientras que los seres humanos tenemos (cierta) libertad de acción, en agrupaciones humanas amplias de distintos lugares y fechas existían ciertas regularidades en números tales como la tasa de suicidio.

Hoy he tenido acceso a datos que el INE no publica: número de suicidios por municipio (mayor de 10000 habitantes) y los que corresponden a la ciudad de Madrid son increíbles. No los tengo, pero sí los de la provincia (que sí que publica el INE):

Rapapolvos al INE

¿Os acordáis de cuando escribí que para ingresar en el INE solo hacía falta estadística viejuna? Pues me cuenta una fuente fidedigna que Eurostat ha realizado una auditoría a nuestro organismo estadístico de cabecera y que le ha caído un buen rapapolvos. Consecuencia del cual, el INE está reformulando los criterios de acceso y tratándose de poner al día.

Igual no es cierto. No soy ducho en eso de manejar fuentes y hablar por terceros, sean o parezcan fidedignos o no. Tal vez me han metido un gol. Mas se non è vero, è ben trovato. Y si lo es, lo sabremos pronto.

La encuesta de presupuestos familiares, en MicroDatosEs

R

Hoy he subido una nueva versión del paquete MicroDatosEs a r-forge que incluye herramientas para cargar los datos de la Encuesta de Presupuestos Familiares.

Aún no está en CRAN, pero estáis invitados a probarla instalando la versión de desarrollo mediante

install.packages("MicroDatosEs", repos="http://R-Forge.R-project.org")

La parte del paquete que se encarga de la EPF es obra de Diego Paniagua, que es uno de los estudiantes del Experto en Data Science de la UTAD. La aportación a este paquete es, de hecho, parte de su proyecto final.

Petición al INE: deseadme suerte

Acabo de realizar (día 2015-04-27) la siguiente petición (autoexplicativa) al INE:

Estimados señores:

En sus páginas pueden descargarse los “Mapas municipales” para ser utilizados conjuntamente con el programa PC-Axis para visualizar datos estadísticos. Junto con los mapas aparecen unos ficheros, p.e., “Mapas a 01-01-2004.txt” en los que se indica que:

“El usuario no está autorizado a redistribuir estos archivos sin previa autorización del INE, lo que ha aceptado al proceder a su instalación.”

¿13.100 más/menos cuántos parados menos?

¿Cuál es la cifra de variación del número de parados de la que hablan la última EPA y los medios? 13100.

¿Más menos cuánto? Según el INE, el error de muestreo relativo, $latex \sqrt{V(\hat{\sigma}}$ a nivel nacional en términos porcentuales es

error_relativo

Es decir, el intervalo de confianza para la cifra de parados tendría una anchura como de 100k sujetos. Obviamente, eso impide calcular variaciones de un orden de magnitud menor.

Datos, datos, datos,... ¿pero qué datos?

Porque según donde mira uno… Veamos un ejemplo. Ha caído en mi mano este documento de Eurostat sobre residuos urbanos y su reciclaje (o no).

Lo primero que me ha llamado la atención han sido los números correspondientes a España:

residuos_urbanos

¿A vosotros no? Qué números tan redondos, ¿verdad? Como si puestos a ojo. Pues sí, son, poco más o menos, a ojo. La tabla tiene una nota en letra diminuta en la que indica que las cifras de España (y algunos otros países) son estimaciones que podrían ser revisadas.