Gráficos

Diagramas de puntos (dotplots)

Aunque los diagramas de puntos fueron introducidos por Cleveland en los años ochenta, a pesar de sus ventajas, no gozan de la popularidad de otros métodos de representación gráfica.

Leí hace poco un artículo de Naomi Robbins en el que se proponían los gráficos de puntos como alternativa a los de barras. Encuentra en aquéllos tres ventajas:

  • Una representación más limpia y con menos tinta inútil.
  • Permite resolver el problema de la representación de varias observaciones por sujeto más elegantemente que yuxtaponiendo barras, como ilustra el gráfico que aparece debajo.
  • Y una tercera que encuentro más dudosa: que resuelven el problema de los diagramas de barras truncados: el no representar el trazo que une el origen con los valores representados —dice la autora—, el efecto perceptualmente distorsionador de truncar la gráfica no es tan acusado. Aunque yo mantengo mis reservas al respecto.

Visualización de datos con Weave

Weave es una plataforma de visualización de datos desarrollada por el Institute for Visualization and Perception Research de la Universidad de Massachusetts en colaboración con el Open Indicators Consortium.

A pesar de su buen aspecto, no he tenido tiempo de probarlo. Pero, aprovechando que se acercan las vacaciones, tal vez alguno de mis lectores puede hacerlo y dejar una nota sobre su funcionamiento, ventajas, desventajas y posibilidades. ¿Algún voluntario?

NComVa y visualización de datos públicos

A la lista de herramientas de visualización y de análisis visual de datos públicos de las que ya hemos hablado en alguna ocasión, tales como Gapminder o Many Eyes, añado hoy unas de cuya existencia he venido a enterarme recientemente: las desarrolladas por la empresa sueca NComVa.

La empresa ha desarrollado para algunos de sus clientes portales tales como el del Banco Mundial, The Economist o el del Istat (INE italiano).

Los más interesados de mis lectores podrán echarle un vistazo al manual de usuario de la aplicación. Y los que estén todavía más interesados, dar guerra para que INEs y otros organismos públicos españoles —o donde quiera que residan— se pongan a la altura de los tiempos.

Explica, el portal divulgativo del INE

Me acaban de hacer llegar la noticia, via Twitter, de la existencia de Explica, el portal divulgativo del INE. Según sus propias palabras,

[d]esarrollamos este sitio web con el objetivo de incrementar la cultura estadística en la sociedad y favorecer así el buen uso de la información estadística. Aquí podrás encontrar un conjunto de productos de carácter divulgativo que permiten conocer los principales conceptos en que se basa la elaboración de la información estadística, el contexto en que se desenvuelve la estadística oficial y algunas curiosidades y aplicaciones.

Graficaca en el FT

La gente que escribe en el Financial Times y mucha de la que lo lee suele vestir de traje. Son gente que sabe de lo que habla y están versados en muchos temas no triviales. Podrían ir en chanclas, pantalones cortos y camisetas viejas sin que eso afectase a su conocimiento y entendimiento de las cosas. Si fuese el caso, con cuatro frases que intercambiásemos con ellos nos daríamos cuenta de que la impresión que tal vez no causasen no se corresponde con su erudita esencia. Pero el hecho es que gastan corbata.

Gráficos (VI): teoría

La última entrega de esta serie sobre gráficos, que tal vez debiera haber sido la primera, mostrará algunos enlaces a recursos en los que educarse en este cienciarte que es el de la representación gráfica de datos.

En primer lugar, mencionaré a los maestros. Cualquiera de los libros que Chambers, Cleveland, Tukey o Tufte hayan escrito juntos o por separado es una biblia en el tema. Son lecturas más que recomendadas. A la lista pronto va a ser preciso añadir a Hadley Wickham y su libro ggplot2: Elegant Graphics for Data Analysis.

Gráficos (V): mapas

En la quinta entrega de mi serie de artículos sobre gráficos quiero mostrar algunos enlaces que he recopilado sobre un asunto que sería más propiamente contenido para nuestros vecinos de GMK: los mapas.

Creo que esto de integrar datos y mapas tiene un nosequé adictivo. Conozco varios casos de personas, incluido yo durante un tiempo, que quedamos atrapados por el encanto que tiene generarlos. Yo, incluso, una vez le di algo de guerra al INE por ver si liberaban con alguna licencia decente los datos cartográficos de los que disponen. Pero creo que puede resultar tan complicado como demoler el edificio que tienen en Castellana y refundar de nuevo nuestra benemérita institución estadística.

Gráficos (IV): tutoriales

La mala vida me ha obligado a posponer hasta el jueves esta nueva entrada sobre mi serie sobre gráficos que tenía prometida para el martes. Espero ser excusado.

Esta entrega es más sustancial que las anteriores y seguro que el lector interesado obtendrá en ella cantidad de material para leer e instruirse durante bastante tiempo. Es una lista de tutoriales recogidos durante varios meses sobre la construcción de gráficos e infografías.

¡Qué prensa tan mala!

Al autor de estas páginas se le cae la baba con las infografías del New York Times (¿sabéis que en ese periódico usan R?) y de The Guardian. Y esperaba, ¡qué menos!, algo si no ya similar, al menos sí decente del, dicen, más serio de los periódicos españoles.

Pero hoy se me ha caído el alma a los pies. Fijáos, fijáos lectores:

¿Veis cómo los porcentajes no tienen nada que ver con las cifras absolutas? Comparad Europa con Oriente Próximo. O con Oceanía. ¿Alguien entiende algo?

Gráficos (III): bitácoras

En la tercera entrega de la serie de gráficos quiero dar a conocer una serie de bitácoras que tratan este tema, muchas de ellas escritas por profesionales de la infografía. En orden alfabético son:

  • Climate Charts & Graphs, con infinidad de mapas y gráficas sobre el cambio climático, desarrollados principalmente con R.
  • Datablog, la bitácora del diario británico The Guardian que bajo el lema facts are sacred, hace un periodismo moderno, de primera línea, utilizando un paradigma no textual.
  • Datapointed es el proyecto del (autoproclamado) artista y científico Stephen Von Worley.
  • Excelcharts no es exactamente lo que su nombre indica: de hecho, el autor parece tener un objetivo oculto: hacer progresar al usuario de Excel hacia herramientas de visualización decentes.
  • Flowingdata, un proyecto de Nathan Yau, candidato a doctor en estadística con especialidad en visualización de datos.
  • En Information Aesthetics, según sus autores, form follows data. Más que publicar contenido original, recoge visualizaciones de otros medios.
  • Information is beautiful es el blog de David McCandless, autor de diversos libros sobre la materia y del que no hay que perderse este vídeo.
  • Information & Visualization es, de entre todas las bitácoras que listo en esta entrada, la que contiene unos gráficos más próximos a los que sería posible realizar con R y herramientas similares. Los autores son más estadísticos que diseñadores gráficos. Uno de ellos, de hecho, fue responsable de las herramientas gráficas de KNIME.
  • Junk Charts, o la enciclopedia de la graficaca.
  • En la bitácora de RevolutionAnalytics también es frecuente ver entradas sobre visualización de datos como ésta. Por supuesto, siempre con un característico saboR.
  • Visual Business Intelligence, el blog de Stephen Few, consultor y autor en el mundo de la visualización, con cierto sesgo hacia las aplicaciones en inteligencia de negocios.
  • visualizing.org, que aspira a desentrañar asuntos complejos a través de los datos y el diseño. Trata de cubrir el hueco que media entre quienes poseen y generan los datos (gobiernos, ONGs, etc.) y quienes han sido entrenados en las técnicas de representación gráfica, especialmente diseñadores.

¡Disfrutadlas!

Gráficos (II): Herramientas

Comenzaré por lo que en todo debiera ser el final: las herramientas. La herramienta tiene que ajustarse a la función y no a la inversa: no coge el carpintero por la mañana un martillo y busca clavos que clavar el resto de la jornada (igualmente tampoco debieran hablar las empresas en primera instancia con, por ejemplo, SAS a la hora de ahondar en sus capacidades analíticas; pero ésa es otra historia). Pero me permitiré alterar el orden lógico de las cosas porque nadie está obligado a leer cuanto esta bitácora contiene en el orden en que le dio la gana a mis musas sino en el que más le convenga.

Gráficos (I): introducción

De no mediar contratiempos, a lo largo de los próximos cinco o seis martes iré subiendo a mi bitácora una serie de entradas sobre una (sub)disciplina en alza. Se la conoce por diversos nombres de desigual empaque —infografía, information design, etc.— pero las ubicaré bajo un epígrafe algo más humilde: gráficos.

Comenzaré citando a Andrew Gelman. En una reciente entrevista (que no tiene desperdicio), éste respondía categóricamente:

Sí, la representación gráfica de unos datos siempre es una estadística.

ggplot2 en su contexto

gplot2 es, sin duda, el paquete gráfico de moda en R. Hay quien lo ama, hay quien lo odia, pero cada vez son menos los que lo ignoran. Lo que igual no es tan sabido por los usuarios de R es el contexto en el que nació ggplot2, su relación con el motor gráfico de R y su relación con otros mecanismos de representación gráfica existentes en otros paquetes estadísticos.