El pomelazo del CSIC

Dado que el CSIC nos está pidiendo que hagamos algo por él, perdí un rato el otro día tratando de averiguar qué había hecho él por mí. Navegando por sus páginas di con este documento y, al abrirlo, recibí este pomelazo en tol’ojo: Carajo, pero ¿quién hizo eso? ¿Por qué? ¿Con qué programa? ¿Nadie en todo el CSIC levantó la voz? ¡Que hablamos del CSIC y no de un ayuntamiento menor! ...

27 de agosto de 2013 · Carlos J. Gil Bellosta

"Datathon for Social Good" de Telefónica

El Datathon for Social Good es una iniciativa de Telefónica para desarrollar aplicaciones analíticas que redunden en un bien social que está teniendo lugar estos días (¡aún hay tiempo para registrarse!). Estos son los tres tipos de datos con los que se contará: Recuento de personas en el área metropolitana de Londres durante 3 semanas, por sexo, edad y grupos para cada área en rango horario. Datos inferidos de cuántos están en su hogar, en trabajo o de visita. Datos abiertos y geo-localizados de medios de transporte (autobús, metro, bicicleta). Admisiones en hospitales. Localizaciones de servicios de emergencia. Datos no-localizados de Twitter con el hash-tag “London”. Cantidad representativa de tuits por hora. Además, la competición será inaugurada con una conferencia a cargo del profesor Alex “Sandy” Pentland del MIT y Gavin Starks, director del Open Data Institute el martes 3 de Septiembre. ...

26 de agosto de 2013 · Carlos J. Gil Bellosta

Así las gastan otros INEs

Este vídeo es una entrevista de la BBC a Will Moy, director de Full Fact, una organización británica dedicada a la comprobación (y denuncia) de datos ofrecidos por políticos y medios de comunicación (y mirad quién está detrás de ella) Andrew Dilnot director de la UK Statistics Authority (el INE británico, para entendernos) que hablan en ella de políticos que hacen referencia a hechos imperfectos. Y, ¿sabéis qué? Resulta que el INE británico envía cartas a políticos de todos los colores en los que les recrimina el uso inadecuado de cifras y datos. Y no solo las envía, sino que las publica. ¡Increíble! ...

23 de agosto de 2013 · Carlos J. Gil Bellosta

El carajal de las representaciones gráficas de "redes sociales"

Seamos honestos: en representaciones gráficas de grafos similares a no vemos/entendemos un carajo. Al menos yo. Es cierto que de vez en cuando los fabrico. Y que aquellos a quienes se los enseño con la cara muy seria, asienten (o, incluso aplauden) por algún motivo. Sospecho que porque piensan que el emperador está vestido (y no en porretas, como parece que les da pudor reconocer). Afortunadamente, hay quienes han asumido el problema (de la falta de interpretabilidad, consecuencia del exceso de información irrelevante de ese tipo de representaciones) y están proponiendo soluciones. El vídeo ...

22 de agosto de 2013 · Carlos J. Gil Bellosta

Mis copias de seguridad

Por referencia mía y de otros, voy a dejar acá escrito y explicado cómo gestiono mis copias de seguridad. Porque los discos duros se rompen y los ordenadores desaparecen. Etc. Primero, mi instalación: tengo un ordenador de bajomesa (tiramisu) y un netbook (kropotkin). Ambos corren la misma versión de Xubuntu, la última estable. Mi primera línea de defensa contra las pérdidas de información es la sincronización de ambas máquinas. Aquellos directorios que contienen cosas que no quiero perder (documentos, fotos, código, ¡copias de seguridad de otras máquinas, incluido esto que lees ahora!, cosas que no son documentos en desarrollo, etc.) se guardan en el directorio .bck de ambos ordenadores. Los directorios que veo son enlaces blandos (vía ln) a subdirectorios de .bck. ...

21 de agosto de 2013 · Carlos J. Gil Bellosta

Mapas, mapas, mapas... ¿y?

No paro de decir para mis adentros “¿y?” según hojeo el recién publicado Atlas de mortalidad en municipios y unidades censales de España. En el prefacio del estudio se lee: En sus páginas encontrará los reflejos de las construcciones sociales que condicionan las oportunidades de salud y bienestar de las personas, mostrando que el espacio para políticas de reducción de desigualdades sociales en salud es amplio. Pues no, no encuentro reflejos de construcciones sociales. Lo que encuentro son áreas administrativas. Las construcciones sociales que ocurren dentro de dichas áreas administrativas brillan, si acaso, por su ausencia. ...

16 de agosto de 2013 · Carlos J. Gil Bellosta

Tres grandes números (con enmienda)

El otro día hablé fatal sobre tres grandes números. Casi me da pudor releer la entrada. Es una flagrante violación de principios que he defendido aquí o http://www.datanalytics.com/2011/01/12/el-precio-del-petroleo-reflejo-del-anumerismo-de-la-prensa/. Así que donde escribí 40.000, 57.000 o 27.000 millones de euros, debí haber escrito 851, 1.595 o 574 euros por barba. Creo que de esta manera quedan bastante más claras (y ciudadanizadas) las magnitudes de las que hablé.

14 de agosto de 2013 · Carlos J. Gil Bellosta

¿Suben o bajan?

La respuesta es sí, obviamente. Pero no todo el mundo maneja la lógica retorcidamente y aplicado a la mediana de los salarios estadounidenses los más comenzaríamos a hacer distingos en lugar de encerrarnos en la tautología. Leo en Revolutions cómo dicha mediana ha crecido un 1% anualmente desde el 2000. Pero, a la vez, la mediana ha descendido en cada uno de los grupos definidos por el nivel de estudios (sin, bachillerato, universitarios, etc.). ...

13 de agosto de 2013 · Carlos J. Gil Bellosta

¡Qué solazo anoche!

Pues sí, anoche debió hacer un buen solazo. Yo dormía y no lo vi, pero lo deduzco de lo que me cuenta Red Eléctrica: Véase cómo a eso de las cuatro de la mañana la producción de energía catalogada como solar era de 360MW. Habida cuenta de que el KWh solar se paga a un precio elevado (y que pagamos/pagaremos todos) a uno se le ocurren unas cuantas preguntas: ¿Cataloga mal REE el origen de la energía? ¿Se está quemando gas en las centrales solares? ¿Hizo sol anoche? Y una nota para que nadie piense que no he hecho los deberes. Y que sirve para arrojar algo de luz sobre un asunto que muchos desconocen. ...

6 de agosto de 2013 · Carlos J. Gil Bellosta

Medianas ponderadas en R

La mediana de 1:3 es 2. Pero puede ser que queramos dar a 1:3 los pesos 2, 1, 2. En ese caso, el cálculo de la mediana sigue siendo sencillo (y sigue siendo 2). Pero la situación puede complicarse más. Mientras los pesos sean enteros, todavía pueden usarse trucos: x <- 1:3 pesos <- c(2,1,2) median(rep(x, times = pesos )) ¿Pero qué hacemos cuando hay pesos fraccionarios? Bueno, en realidad, podemos ordenar: n <- 1000 x <- runif(n) pesos <- runif(n) o <- order(x) x.o <- x[o] pesos.o <- pesos[o] x.o[min(which(cumsum(pesos.o) > .5 * sum(pesos.o)))] Pero me parece más limpio usar el paquete quantreg: ...

5 de agosto de 2013 · Carlos J. Gil Bellosta