¿Escalas logarítmicas? Puede, pero...

Encontré el otro día una entrada en la bitácora de Bissantz, una empresa alemana de herramientas de visualización y minería de datos, que trataba sobre las ventajas y desventajas del uso de escalas lineales y logarítmicas en cierto tipo de gráficos. Y las ilustraba con un ejemplo que me hizo pensar si no habría algo más. El gráfico malo, en escala lineal, es que representa la evolución del PIB y la deuda estadounidense durante las últimas décadas y tiene una serie de carencias con respecto al gráfico de los mismos datos en escala logarítmica, ...

25 de noviembre de 2011 · Carlos J. Gil Bellosta

Vídeos de las charlas de Alberto Cairo y Alberto Alcaraz

Diríase que estos días no escribo de otra cosa. Pero como que toca. Ya cambiaré de cuerda. En realidad, hoy debería haber escrito sobre unas conferencias de MicroStrategy a las que acudí ayer “para hablar de mi libro”, es decir, dar la tabarra a empresas que usan, más o menos subrepticiamente R en sus productos para que sepan que existe una asociación de usuarios en ciernes y, con un poco de suerte, aflojen algún billete. Porque, aparte de eso,solo pude constatar que la parte relevante del empresariado español no lee a Tufte. ...

24 de noviembre de 2011 · Carlos J. Gil Bellosta

El 3 de diciembre, Open Data Hackathon

Me llega la noticia de que el 3 de diciembre tendrá lugar el Open Data Day, […] una reunión de ciudadanos en ciudades de todo el mundo para escribir aplicaciones, liberar datos, crear visualizaciones y publicar análisis utilizando datos públicos abiertos con el fin de apoyar y animar a adoptar políticas de datos abiertos por parte de los gobiernos locales, regionales y nacionales de todo el mundo. Arturo (del blog Madrid Me Mata) y Oscar Corcho de la UPM están organizando el evento en Madrid. El primero dice que la idea es hacer una pequeña introducción más o menos teórica para después ponernos a trabajar sobre un set de datos, como siempre esa es la parte que está un poco más en el aire y cualquier propuesta en este sentido vendría muy bien. ...

23 de noviembre de 2011 · Carlos J. Gil Bellosta

Grupo de trabajo sobre periodismo de datos en Madrid

El miércoles pasado, en el Medialab Prado de Madrid tuvo lugar la primera reunión del grupo de trabajo sobre Periodismo de datos. Contó con la presencia de Alberto Cairo, cuyo reciente libro, El arte funcional, espero que pase a engrosar mi colección pronto. En el programa aparecen sesiones tan interesantes como las siguientes: 12.01.2012. Mini taller y charla sobre la captura de datos. 09.02.2012. Mini taller y charla sobre el análisis y el tratamiento de los datos 08.03.2012. Mini taller y charla sobre la presentación y visualización de los datos. Tengo la impresión de que la comunidad de usuarios de R tiene mucho que aportar a esta iniciativa tan radical en el mundo del periodismo. De hecho, Amanda Cox, del New York Times, ha participado en grupos de usuarios de R mostrando cómo los ayuda a desarrollar su labor. ...

22 de noviembre de 2011 · Carlos J. Gil Bellosta

III Jornadas de Usuarios de R: algunas reflexiones

La semana pasada no actualicé mi bitácora. Nunca había dejado pasar tanto tiempo sin escribir. Y es que, por si alguien no se había enterado aún, el jueves y el viernes tuvieron lugar las III Jornadas de Usuarios de R. Hace dos años escribí un pequeño resumen sobre las primeras. El año pasado me atreví a hacer lo mismo con las segundas. Pero, lo siento, este año me excede el hacerlo para las terceras. Y es que han excedido en mucho la dimensión de las anteriores: ...

21 de noviembre de 2011 · Carlos J. Gil Bellosta

Hoy, el primer encuentro del Grupo de Usuarios de R de Argentina

A una semana de las III Jornadas de Usuarios de R, hoy día 11 del 11 del 11, va a tener lugar el Primer Encuentro del Grupo de Usuarios de R de Argentina. Quiero felicitar a los organizadores del encuentro e invitar a los usuarios de R de otros países a organizarse y organizar reuniones como las anteriores.

11 de noviembre de 2011 · Carlos J. Gil Bellosta

741 millones de barriles de petróleo, ¿mucho o poco?

Nos amaneció el otro día la prensa con la noticia de que Repsol YPF ha descubierto 741 millones de barriles de petróleo en Argentina. De hecho, periódicamente se realizan hallazgos de mayor o menor cuantía. Y se nos presentan en la prensa con tan falta de contexto y en términos tan ponderativos que es difícil hacerse una idea de lo minúsculos que resultan si se analizan bajo una perspectiva menos anumérica. ...

10 de noviembre de 2011 · Carlos J. Gil Bellosta

"Bump charts" para comparar gráficamente proporciones entre periodos

Hojeaba el otro día el informe Reporta 2011, que evalúa la calidad de la información que sobre su actividad publican las empresas cotizadas en las bolsas españolas. Y aunque haya que valorar la intención de los autores, resultan tan manifiestas ciertas carencias analíticas que mal servicio les haría de no afeárselas desde mi bitácora. Que conste que no me refiero a errores de fondo, materia en la que no entro, sino a los mecanismos para tratar y presentar resultados numéricos a la hora de armar el informe. ...

8 de noviembre de 2011 · Carlos J. Gil Bellosta

Disponible el programa de las III Jornadas de Usuarios de R

Acaba de publicarse el programa (casi) definitivo de las III Jornadas de Usuarios de R. Los números son impresionantes: 44 ponencias, una conferencia plenaria de primerísimo nivel, 5 talleres, más de 200 asistentes (estimados),… Además, dentro de las Jornadas se discutirán y aprobarán los estatutos de la futura Asociación de Usuarios de R (nombre tentativo). ¿Nos veremos todos en 10 días?

7 de noviembre de 2011 · Carlos J. Gil Bellosta

¿Es abierto todo lo que reluce? Resultados

Habiendo hecho eco el otro día en esta bitácora del anuncio de un estudio del grado de real de apertura de los datos del proyecto Aporta, de rigor es que haga mención de los resultados. En resumen: El 3% de las fuentes de datos que comprende el proyecto cumplen los requisitos mínimos de apertura El 39% de las fuentes de datos catalogadas contienen datos propiamente dichos (y no imágenes, documentos, etc.) En términos de formatos, el 88% (¿del 39% anterior?) son adecuados El 40% permite el acceso directo a la información El 15% de las fuentes de datos permitían la reutilización ¡Pobre resumen! ...

4 de noviembre de 2011 · Carlos J. Gil Bellosta