Gráficos

Dos técnicas fundamentales para gráficos dinámicos de datos: "linking" y "brushing"

El otro día me tocó enseñar algo de lo que no sé mucho: gráficos interactivos con R. Hay muchos paquetes que vienen a hacer más o menos lo mismo. Es tentador limitarse a eso, a exponerlas. O más bien, a exponer unas vías de entrada, a establecer unas cabezas de playa desde las cuales el interesado pueda avanzar autónomamente.

Tanto (tentador) que uno pasa por alto la razón de ser misma de querer incorporar interactividad a los gráficos. Por el camino, dos técnicas fundamentales y muy útiles para tal fin: linking y brushing.

Una abominación gráfica

Llega el verano, llega el relleno: rescato de mi disco duro una abominación gráfica,

mapa-mundo-compressor-1

para el espanto de todos Vds.

Aparte de otras consideraciones, si la tasa es negativa, ¿se crea una imagen especular del perfil del país?

Tartas con porciones negativas

Aunque te pueda costar imaginarlas, existen:

tarta00

Están sacadas de la página de Red Eléctica (es que hoy he puesto una lavadora) y el gajo que sobresale a las diez es la aportación negativa de la conexión con las Baleares a sistema eléctrico peninsular:

tarta01

¿Por qué —me pregunto— añadirán un uso de la electricidad en una gráfica que, según su título, corresponde a su generación? ¿Quién tuvo la idea de colocar un gajo negativo? ¿Quién tuvo la idea de utilizar tartas? ¿¡Quién, quién, quién!?

Gráficos interactivos con R: un resumen

Aquí encontrará el lector un resumen de herramientas para crear gráficos interactivos con R que, por referencia, discute

  • ggvis: desarrollados por los creadores de ggplot2
  • rCharts: una interfaz de R con una serie de librerías de javascript para crear gráficos
  • plotly: hace magia para añadir interactividad a gráficos creados con ggplot2 (y otros)
  • googleVis: que permite utilizar Google Chart Tools desde R

Hoy que me he puesto traje y corbata...

… (por motivos que importan pero no debo revelar a mis lectores) aprovecho para criticar a esos tipos que, vistiendo como yo, insisten reiteradamente a sus analistas en que les proporcionen un número. Un número que tiene que ser cerrado, indiscutible, pivotal.

A esos que gastan traje y corbata como yo hoy les horroriza la varianza. Le espantan, seguro, esos punticos que tan opotunamente coloca Kiko Llaneras alrededor de las medias de este estupendo

Ficheros KML con R y ggmap

Fácil:

library(maptools)
library(ggmap)

# un fichero bajado el Ayto. de Madrid
# (catálogo de datos abiertos)
rutas <- getKMLcoordinates("dat/130111_vias_ciclistas.kml")

# procesando el fichero kml
rutas <- lapply(1:length(rutas),
    function(x) data.frame(rutas[[x]], id = x))
rutas <- do.call(rbind, rutas)

# mapa de Madrid
mapa <- get_map("Madrid",
    source = "stamen", maptype = "toner",
    zoom = 12)

# pintando los tramos sobre el mapa
ggmap(mapa) + geom_path(aes(x = X1, y = X2,
    group = id), data = rutas,
    colour = "red")

produce

rutas_ciclistas_madrid

Nota: KML es esto.

Visualización de datos de salud con nihil obstat científico

Investigando para las clases del máster de visualización de datos de Unidad Editorial (que arranca hoy mismo), di con Vizhealth, una guía de estilo para la representación de datos relativos a la salud de los individuos con el nihil obstat de un equipo multidisciplinar de médicos, diseñadores, sicólogos, etc.

vizhealth

Id, que ellos lo cuentan mejor que yo, y visitad la galería de ejemplos.

Visualizando los quinientos millones de la Begún

¿Te acuerdas —dijo— de que Binóme, nuestro profesor de matemáticas, repetía todos los años, al explicar la numeración, en la lección primera, que medio millar de millones es un número demasiado considerable para que las fuerzas de la inteligencia humana pudieran adquirir de él una idea exacta, si no tuviesen a su disposición los recursos de una representación gráfica…?

Julio Verne, Los quinientos millones de la begún, 1879

¿Os lo podéis creer? ¡"Funnel plots" en la prensa española!

Pues sí, aquí están,

funnel_plots_suicidios

recién copipegados del documental de El Español sobre el suicidio.

Son los mismos de los que hablaba aquí o sobre los que Spiegelhalter ha publicado la mar de artículos.

Pero, ¿qué hacen en la prensa de un país como España? La historia es un poco larga, casi tanto como la mía protestando de la escasa calidad de los gráficos estadísticos por doquier. Pero esta vez los autores del documental me han invitado renunciar a la comodidad del crítico que todo lo juzga desde el sillón a, digámoslo así, consultor (o consejero) que tiene que pasar a proponer soluciones.

La variación y sus negacionistas

Las entradas de esta semana han girado alrededor de un tema: la comparación bajo incertidumbre. La remato recomendando un artículo de Stephen Few, Variation and Its Discontents, que tiene un subtítulo de lo más oportuno: Funnel Plots for Fair Comparisons.

Nota: Los lectores más fieles de estas páginas recordarán entradas viejas, como esta, que también sugerían el uso de gráficos de embudo (o trompeta).

Extraido de un libro de educación primaria

Del capítulo de estadística de un libro de matemática para críos capturé el otro día

tartas_libro

¿A qué os imagináis lo que se me pasó por la mente? Pues no lo digo por si algún día llego a concejal.

El lenguaje de los gráficos en las Jornadas de Periodismo de Datos

Este sábado (2015-06-06), dentro de las Jornadas de Periodismo de Datos, hablaré sobre el lenguaje de los gráficos (véase el programa).

Para variar, nada de R y, aunque parezca lo contrario, nada de ggplot2. Ni tan siquiera respuestas a nada: solo preguntas que cada cual tendrá, si le place, que contestar. Y si se me hace caso, a la luz de la literatura relevante.

¿Por qué una cuestión tan abstracta? Porque sobran herramientas y recetarios sobre cómo hacer esto y aquello. Pero falta teoría. No seré yo quien pretenda enseñarla: ni siquiera la domino. Solo que soy consciente de que existe y mucha otra gente no.