Números
¿Cuánto vale un billete del AVE a Valencia? Una cota inferior
Hice una vez la cuenta y luego se me olvidó. La voy a dejar escrita en mi bitácora para tenerla a mano.
Según ADIF, el AVE Valencia (o a Madrid, según desde donde se lo mire), costó (o al menos, tal fue la inversión total prevista) 12400 millones de euros y la estimación anual de viajeros es de 3 millones.
Supongamos que el coste de la infraestructura se financia con deuda al, por ejemplo, 4%. Entonces, el coste de los los intereses por viajero es de 12400 * 0.04 / 3 = 165 euros. Pero el billete cuesta, aparentemente, 78 euros.
Gráficos de embudo para controlar la varianza en muestras pequeñas
Publiqué hace un tiempo una entrada en esta bitácora sobre el problema que representa la desigualdad de los tamaños muestrales a la hora de comprender cierto tipo de datos, como por ejemplo, los que trata de representar el gráfico
que muestra la incidencia del cáncer de riñón en distintas zonas de en EE.UU. Como indiqué entonces, los valores extremos se encuentran en zonas menos pobladas: cuanto menor es la población, más probables son las proporciones inhabituales.
Estadísticas de incendios forestales en España
El Ministerio de Medio Ambiente recoge estadísticas sobre incendios forestales. Lo hace, por así decirlo, a la vieja usanza:
La Dirección General de Medio Natural y Política Forestal del Ministerio de Medio Ambiente y Medio Rural y Marino acumula los datos provinciales y obtiene las cifras nacionales del año en curso. Estas cifras se muestran en un cuadro que las compara con las del decenio anterior en el mismo intervalo de fechas.
Precios de la vivienda e intención de voto, por Nestoria
Nestoria, uno de los patrocinadores de las III Jornadas de Usuarios de R, ha realizado un estudio en el que relaciona el precio de la vivienda en Madrid con los últimos resultados electorales obteniendo relaciones tan claras como esta:
De hecho, Nestoria —a diferencia de tantos organismos públicos que no publican, valga la antirredundancia, sus datos— proporciona una API para acceder a sus bases de datos de precios. Esto permite cruzar este tipo de información, hasta ahora de difícil obtención, con otras variables para ayudar a comprender mejor determinados fenómenos sociales.
Grandes avances criptográficos... según El País
Apenas sé de criptografía y no es un tema que me interese demasiado. Sin embargo leí un artículo en El País de la semana pasada titulado Desvelado el significado oculto del ‘Copiale Cipher’. Se refiere a un libro que contenía los estatutos de cierta secta masónica de mediados del siglo XVIII. Y dice textualmente .
Aunque el artículo habla principalmente de la masonería, las normas, la historia del manuscrito y otras lindezas, describe brevemente la técnica de desencriptación:
Doping, héroes patrios y... estadística
Este verano traté de recorrer en bici la ruta del Viaje a la Alcarria de Cela. No lo acabé porque se lesionó mi compañero a la altura de Pareja y tuvimos que regresar a Madrid en furgoneta. Pero recuerdo que, encarando algún repecho, con la lengua afuera, me comentaba qué duro es esto de la bici. Aproveché luego, en la fuente de algún pueblo, con las camisetas empapadas, para comentarle lo despiadado del circunstancial televidente estival, faria en mano, exigiendo a los ciclistas patrios demarres sobrehumanos en el Tourmalet.
Vídeos de las charlas de Alberto Cairo y Alberto Alcaraz
Diríase que estos días no escribo de otra cosa. Pero como que toca. Ya cambiaré de cuerda.
En realidad, hoy debería haber escrito sobre unas conferencias de MicroStrategy a las que acudí ayer “para hablar de mi libro”, es decir, dar la tabarra a empresas que usan, más o menos subrepticiamente R en sus productos para que sepan que existe una asociación de usuarios en ciernes y, con un poco de suerte, aflojen algún billete. Porque, aparte de eso, sólo pude constatar que la parte relevante del empresariado español no lee a Tufte.
El 3 de diciembre, Open Data Hackathon
Me llega la noticia de que el 3 de diciembre tendrá lugar el Open Data Day,
[…] una reunión de ciudadanos en ciudades de todo el mundo para escribir aplicaciones, liberar datos, crear visualizaciones y publicar análisis utilizando datos públicos abiertos con el fin de apoyar y animar a adoptar políticas de datos abiertos por parte de los gobiernos locales, regionales y nacionales de todo el mundo.
Arturo (del blog Madrid Me Mata) y Oscar Corcho de la UPM están organizando el evento en Madrid. El primero dice que la idea es hacer una pequeña introducción más o menos teórica para después ponernos a trabajar sobre un set de datos, como siempre esa es la parte que está un poco más en el aire y cualquier propuesta en este sentido vendría muy bien.
Grupo de trabajo sobre periodismo de datos en Madrid
El miércoles pasado, en el Medialab Prado de Madrid tuvo lugar la primera reunión del grupo de trabajo sobre Periodismo de datos. Contó con la presencia de Alberto Cairo, cuyo reciente libro, El arte funcional, espero que pase a engrosar mi colección pronto.
En el programa aparecen sesiones tan interesantes como las siguientes:
- 12.01.2012. Mini taller y charla sobre la captura de datos.
- 09.02.2012. Mini taller y charla sobre el análisis y el tratamiento de los datos
- 08.03.2012. Mini taller y charla sobre la presentación y visualización de los datos.
Tengo la impresión de que la comunidad de usuarios de R tiene mucho que aportar a esta iniciativa tan radical en el mundo del periodismo. De hecho, Amanda Cox, del New York Times, ha participado en grupos de usuarios de R mostrando cómo los ayuda a desarrollar su labor.