Gráficos

Visualización de la incertidumbre sobre el futuro

Recomiendo a mis lectores el artículo Visualizing Uncertainty About the Future de D. Spiegelhalter, M. Pearson e I. Short. Trata sobre qué tipo de representaciones gráficas son más adecuadas para transmitir información acerca de la probabilidad de fenómenos futuros a distintos tipos de audiencias, incluidas las más anuméricas.

Abarca desde los incipientes trabajos de Nightingale y Neurath hasta Gapminder y los más modernos desarrollos de la infografía. Aplaude, por ejemplo, la iniciativa del Banco de Inglaterra de publicar información sobre la posible evolución de indicadores económicos futuros de la forma

Visualización de la actualización bayesiana (y unas cuantas funciones de R)

Me ha llegado noticia de una entrada en un blog, Visualizing Bayesian Updating, en el que se muestra visualmente cómo se actualiza la distribución a posteriori conforme aumenta el número de ensayos en un problema bayesiano simple. Explica también los fundamentos estadísticos del asunto.

Yo me limitaré a ofrecer una nueva versión del código —que no funcionaba copiando y pegando sin más— en el que he introducido ciertas modificaciones. Es el siguiente:

Treemaps en R

Hay cierto interés por los treemaps en general y existen paquetes como treemap y la función map.market del paquete portfolio que permiten construirlos y obtener gráficos como este

que representa la capitalización bursátil de las empresas del IBEX-35 y el porcentaje que destinan al dividendo. Pero me produce cierto desasosiego utilizar áreas y colores para representar magnitudes: ¿es fácil comparar el tamaño relativo de TEF y ELE? ¿Cuánto mayor es ITX que BBVA? ¿Y el dividendo de MAP comparado con el de ACS?

Un paseo por Google Fusion Tables

El siguiente vídeo contiene una entrevista con Alon Halevy, que dirige el Data Group en Google Research. Aunque confunda Suecia y Finlandia, merece la pena la presentación que hace de Google Fusion Tables, una plataforma para compartir, combinar, distribuir y representar gráficamente conjuntos de datos.

"Arte gráfico" con R

R

El otro día dí con un blog dedicado al arte matemático y en particular con esta entrada sobre cómo crear figuras mediante rotación de segmentos:

El código (en matlab) estaba disponible y lo traduje a R:

graphic.art <- function( foo, n = 200, init = -1, end = 1, breaks = 20 ){
    x <- seq( init, end, by = 1 / breaks )
    base <- matrix( c( x, foo( x ) ), ncol = 2 )
    rotate <- function(a,m) m %*% matrix(c(cos(a), -sin(a), sin(a), cos(a)), 2)
    my.lines <- sapply( 2 * pi * ( 1:n ) / n, rotate, base, simplify = F )
    limits <- data.frame(do.call(rbind, my.lines))
    limits <- data.frame(lapply(limits, range))
    plot(limits, type = "n")
    lapply(my.lines, function(x) lines(x, col = sample(colours(), 1)))
}

Unos querrán probar diversas opciones:

Diagramas de puntos (dotplots)

Aunque los diagramas de puntos fueron introducidos por Cleveland en los años ochenta, a pesar de sus ventajas, no gozan de la popularidad de otros métodos de representación gráfica.

Leí hace poco un artículo de Naomi Robbins en el que se proponían los gráficos de puntos como alternativa a los de barras. Encuentra en aquéllos tres ventajas:

  • Una representación más limpia y con menos tinta inútil.
  • Permite resolver el problema de la representación de varias observaciones por sujeto más elegantemente que yuxtaponiendo barras, como ilustra el gráfico que aparece debajo.
  • Y una tercera que encuentro más dudosa: que resuelven el problema de los diagramas de barras truncados: el no representar el trazo que une el origen con los valores representados —dice la autora—, el efecto perceptualmente distorsionador de truncar la gráfica no es tan acusado. Aunque yo mantengo mis reservas al respecto.

Y Kenia qué, ¿eh?

—Sí, ya sabemos que en EE.UU. e Inglaterra las cosas son distintas, pero nosotros semos mediterráneos y tenemos sol y aceite de oliva.

—Además, uno siempre puede comprar la publicación España en cifras en las librerías Índice a un precio popular establecido anualmente en el BOE (o, incluso, ¡descargarla en PDF gratis!).

Ejque

Etc.

Pero, y Kenia qué, ¿eh? ¿Nos vamos a dejar ganar por Kenia?

Visualización de datos con Weave

Weave es una plataforma de visualización de datos desarrollada por el Institute for Visualization and Perception Research de la Universidad de Massachusetts en colaboración con el Open Indicators Consortium.

A pesar de su buen aspecto, no he tenido tiempo de probarlo. Pero, aprovechando que se acercan las vacaciones, tal vez alguno de mis lectores puede hacerlo y dejar una nota sobre su funcionamiento, ventajas, desventajas y posibilidades. ¿Algún voluntario?

NComVa y visualización de datos públicos

A la lista de herramientas de visualización y de análisis visual de datos públicos de las que ya hemos hablado en alguna ocasión, tales como Gapminder o Many Eyes, añado hoy unas de cuya existencia he venido a enterarme recientemente: las desarrolladas por la empresa sueca NComVa.

La empresa ha desarrollado para algunos de sus clientes portales tales como el del Banco Mundial, The Economist o el del Istat (INE italiano).

Los más interesados de mis lectores podrán echarle un vistazo al manual de usuario de la aplicación. Y los que estén todavía más interesados, dar guerra para que INEs y otros organismos públicos españoles —o donde quiera que residan— se pongan a la altura de los tiempos.

Explica, el portal divulgativo del INE

Me acaban de hacer llegar la noticia, via Twitter, de la existencia de Explica, el portal divulgativo del INE. Según sus propias palabras,

[d]esarrollamos este sitio web con el objetivo de incrementar la cultura estadística en la sociedad y favorecer así el buen uso de la información estadística. Aquí podrás encontrar un conjunto de productos de carácter divulgativo que permiten conocer los principales conceptos en que se basa la elaboración de la información estadística, el contexto en que se desenvuelve la estadística oficial y algunas curiosidades y aplicaciones.

Graficaca en el FT

La gente que escribe en el Financial Times y mucha de la que lo lee suele vestir de traje. Son gente que sabe de lo que habla y están versados en muchos temas no triviales. Podrían ir en chanclas, pantalones cortos y camisetas viejas sin que eso afectase a su conocimiento y entendimiento de las cosas. Si fuese el caso, con cuatro frases que intercambiásemos con ellos nos daríamos cuenta de que la impresión que tal vez no causasen no se corresponde con su erudita esencia. Pero el hecho es que gastan corbata.

Gráficos (VI): teoría

La última entrega de esta serie sobre gráficos, que tal vez debiera haber sido la primera, mostrará algunos enlaces a recursos en los que educarse en este cienciarte que es el de la representación gráfica de datos.

En primer lugar, mencionaré a los maestros. Cualquiera de los libros que Chambers, Cleveland, Tukey o Tufte hayan escrito juntos o por separado es una biblia en el tema. Son lecturas más que recomendadas. A la lista pronto va a ser preciso añadir a Hadley Wickham y su libro ggplot2: Elegant Graphics for Data Analysis.

Gráficos (V): mapas

En la quinta entrega de mi serie de artículos sobre gráficos quiero mostrar algunos enlaces que he recopilado sobre un asunto que sería más propiamente contenido para nuestros vecinos de GMK: los mapas.

Creo que esto de integrar datos y mapas tiene un nosequé adictivo. Conozco varios casos de personas, incluido yo durante un tiempo, que quedamos atrapados por el encanto que tiene generarlos. Yo, incluso, una vez le di algo de guerra al INE por ver si liberaban con alguna licencia decente los datos cartográficos de los que disponen. Pero creo que puede resultar tan complicado como demoler el edificio que tienen en Castellana y refundar de nuevo nuestra benemérita institución estadística.