Números

¿Cuánta gente ha habido sobre la faz de la tierra?

Una vez oí que 70000 millones, de los que 7000 estaban vivos actualmente. Oí mal porque, buscando, he encontrado esto, de donde extraigo:

tabla_vivos

y

tabla_vivos_2

¡Un 6.5% de todos los que hemos sido estamos vivos!

Y me pregunto: ¿cuál será el porcentaje equivalente entre todos los que han sabido leer y escribir? ¿Cuántos de los que han sabido hacer música? ¿Cuántos de los escritores? ¿Cuántos de los que han tenido una existencia que no se redujese a subsistir precariamente?

Banzhaf y las elecciones que se nos vienen

Es pertinente rescatar una entrada de hace tres años sobre D’Hondt y Banzhaf. En el enlace, los detalles.

Me limitaré a actualizar el código de la función para que muestre las alianzas (algunas enteramente esperpénticas) posibles, que queda de la forma

banzhaf <- function(x){
  x <- -sort(-x)
  x <- x/sum(x)

  foo <- function(a,b,p){
    if(p>1/2)
      return(list(a))

    if (length(b)==0)
      return(NULL)

    b.prima <- b[-1]
    delta <- b[1]
    p.delta <- x[delta]

    return(c(foo(c(a,delta), b.prima, p+p.delta), foo(a,b.prima,p)))
  }

  res <- foo( NULL, names(x), 0)
  print(res)
  sort( table(unlist(res)) / length(res) )
}

y a aplicarlo sobre algunos casos de la más rabiosa actualidad que Leda Duelo ha tenido la gentileza de preparar para mí y, a través de esta página, para ti también. Son los que siguen.

Frecuencias naturales (y consumo de cerveza)

Las frecuencias naturales se utilizan como alternativa a los porcentajes para expresar probabilidades en lugar de, por ejemplo, porcentajes.

frecuencias_naturales

El gráfico anterior está extraído de este documento en el que sus autores argumentan que transmite más eficazmente la idea de probabilidad que los porcentajes desnudos tan habituales.

Entienden que es preferible decir que de cada 100 litros de cerveza vendidos en España, 20 se distribuyen en botella, 30 en lata y 30 en barril (¡ya sé que no suman 100!) que reescribir la información anterior en forma de porcentajes. Eso, sí, respetando una misma cantidad de partida y porsupuestísimo, no escribiendo, como aquí, que

Cualquier parecido con la realidad es pura coincidencia

@adolflow (en persona) viene hoy y me dice si lo he visto. ¿Qué cosa? Se refiere a lo que han publicado en El Español, España en Cifras. Lo miro por encima y encuentro

tasa_paro_municipal

¡Tasa de paro municipal! Lo siento, @adolflow, pero tal cosa no existe. No, no es que los datos sean secretos, no sean transparentes, no sean reutilizables. Es, simplemente, que no existe.

¿Peros?

No, no hay peros. Fijáte: hay 8000 municipios y la EPA se basa en una encuesta de unos 60000 hogares. ¡Echa cuentas!

Petición al INE: deseadme suerte

Acabo de realizar (día 2015-04-27) la siguiente petición (autoexplicativa) al INE:

Estimados señores:

En sus páginas pueden descargarse los “Mapas municipales” para ser utilizados conjuntamente con el programa PC-Axis para visualizar datos estadísticos. Junto con los mapas aparecen unos ficheros, p.e., “Mapas a 01-01-2004.txt” en los que se indica que:

“El usuario no está autorizado a redistribuir estos archivos sin previa autorización del INE, lo que ha aceptado al proceder a su instalación.”

¿13.100 más/menos cuántos parados menos?

¿Cuál es la cifra de variación del número de parados de la que hablan la última EPA y los medios? 13100.

¿Más menos cuánto? Según el INE, el error de muestreo relativo, $latex \sqrt{V(\hat{\sigma}}$ a nivel nacional en términos porcentuales es

error_relativo

Es decir, el intervalo de confianza para la cifra de parados tendría una anchura como de 100k sujetos. Obviamente, eso impide calcular variaciones de un orden de magnitud menor.

Madrid, ¿ciudad inteligente? ¿O tal vez solo un poco menos sorda?

Madrid es la ciudad más inteligente de Europa. Gracias al proyecto MiNT, con un presupuesto de 14 millones, van a ocurrir cosas de lo más futurista:

El sistema permite que cualquier ciudadano o revisor pueda comunicar cualquier incidente en tiempo real desde su propio terminal o teléfono móvil, mediante el envío de una fotografía con su correspondiente información geográfica. De esta manera, la herramienta de análisis INSA recibirá los datos y los pondrá a disposición del Ayuntamiento y de los proveedores para poder solucionarlo, y con el tiempo incluso, adelantarse a las posibles incidencias.

La información es sorpresa

Hace unos días publiqué esto en Twitter:

David Cabo, muy oportunamente, denunció

Cosa que no niego. La frase que resumía el enlace tiene esa pintaza. No obstante, el artículo al que apunta es una elaboración de esa frase. El artículo, además, incluye (y no es habitual) referencias a dos artículos académicos (que no he consultado) que, entiendo, tratan y desarrollan la cuestión.

Adaequatio rei et intellectus

La correspondencia entre las ideas y las cosas. Un añejo criterio de verdad. Me viene a la memoria (y, por ende, a estas páginas) por dos motivos. El primero, que tengo fresco el adagio.

El segundo, que acabo de terminar de leer un libro lógicamente bien estructurado pero con un grave problema: la no correspondencia entre el constructo y la realidad. A mis cuarenta años no pueden venir a contarme que lo que veo cuando me planto en medio de la plaza de Cascorro y echo un vistazo alrededor no es lo que es; que lo que es es lo que escriben desde sus muy encumbrados despachos los tres coautores de la cosa.

Datos, datos, datos,... ¿pero qué datos?

Porque según donde mira uno… Veamos un ejemplo. Ha caído en mi mano este documento de Eurostat sobre residuos urbanos y su reciclaje (o no).

Lo primero que me ha llamado la atención han sido los números correspondientes a España:

residuos_urbanos

¿A vosotros no? Qué números tan redondos, ¿verdad? Como si puestos a ojo. Pues sí, son, poco más o menos, a ojo. La tabla tiene una nota en letra diminuta en la que indica que las cifras de España (y algunos otros países) son estimaciones que podrían ser revisadas.

Mileuristas... anuales

Publicaba el otro día El País una nómina de Franco de noviembre de 1935 con un líquido a percibir de 2.429,98 pesetas. Según el articulista,

[s]i comparamos aquella cantidad con el coste de la vida actual, la equivalencia se elevaría a 5.261,80 euros. Así lo ha calculado para EL PAÍS Ernesto Poveda, del Grupo Icsa, dedicado, entre otras cosas a asuntos de observatorio salarial. El trabajo está hecho con arreglo a la tabla de actualización de precios al consumo que establece Jordi Maluquer de Motes, catedrático de la Universidad Autónoma de Bellaterra (Barcelona). “Se trata de la referencia utilizada por los historiadores económicos avalada por el Banco de España”, explica Poveda.

Campaña de alfabetización numérica... para diputados

¿Sabe de números tu próximo representante?

Al preguntar a los diputados actuales acerca de la probabilidad de obtener dos caras consecutivas al lanzar una moneda, solo el 40% de ellos obtuvieron la respuesta correcta. ¿Lo harán mejor lo siguientes?

[…]

Así, pero en inglés, comienza esta nota de la Royal Statistical Society que sugiere a los votantes (del RU, desgraciadamente) invitar a sus candidatos a formarse en los rudimentos de la estadística y el análisis y comprensión de datos.

Licencias urbanísticas: datos y votos

Una de mis aficiones recientes es la de echarle un vistazo a las licencias de apertura de los locales de Madrid. Son un cartelito que suelen tener colgado en la puerta (con una H verde y grande en hostelería) donde se indica, entre otras cosas, el aforo y la fecha de concesión.

(Lo del aforo no es asunto baladí: sin un aforo oficial, no existe exceso de aforo,… ¿y si luego pasa algo?).