Periodismo De Datos

No es país para "biplots"

No, parece que aún no estamos preparados para los biplots. En el curso Introduction to Infographics and Data Visualization de Alberto Cairo, nos pidieron sugierir mejoras y alternativas a este gráfico:

En el curso aparecieron sugerencias tales como esta,

esta, y otras similares que jugaban con los elementos gráficos habituales con más o menos arte, mejor o peor gusto en los colores, etc.

A mí se me ocurrió que los datos que aparecen en el gráfico original podía, con alguna salvedad y abusando del lenguaje, considerarse una especie de tabla de contingencia que incluía el número de personas que en cada país hacen uso de distintos tipos de servicios de internet. Y que entonces podría utilizar herramientas gráficas, tales como los biplots para visualizar los datos. El resultado fue

Tesis de maestría: periodismo de datos, "big data" y "open data"

Tal vez a quienes siguen estas páginas les interese echar un vistazo a la tesis de maestría de Ángeles Mariño.

He aquí la introducción:

A medida que la información disponible en Internet se ha ido multiplicando, el Periodismo también fue ampliando sus fuentes de información de manera tan relevante que nació una nueva forma de contar historias: el Periodismo de Datos (Data Journalism en inglés), aquel que se basa principal o exclusivamente en bases de datos y documentación en línea para crear una historia.

La crisis es buena para la salud, parece

Ayer leí el artículo Las listas de espera se agravan en El País que parece indicar indirectamente que la crisis tiene efectos beneficiosos para la salud.

Leyendo el artículo uno se queda con la copla de que ha crecido tanto el tiempo medio de espera para los tratamientos médicos como el número de personas que los aguardan. Los números pueden verse en el gráfico anterior, extraído del artículo. Lo curioso es que las proporciones son desiguales.

Cultura numérica, incultura numérica

Traigo hoy dos enlaces relacionados a mi bitácora.

No sé si conocéis OWNI, un Objet Web Non Identifié. Una de sus tres secciones prominentes se llama Cultures Numériques. No datos. No periodismo de datos. No OpenData. Sino culturas numéricas (supongo que el plural es un brindis a la ultracorrección política). Que tal sea el nombre invita a reflexiones que habrían de germinar por sí solas en las mentes de mis lectores.

El segundo tiene esta entradilla (con mi traducción):

Balanzas fiscales y periodismo basado en datos

Dudo al escribir sobre el asunto porque el contexto del artículo que traigo a colación es ajeno al interés de esta bitácora. Pero me ha parecido un ejercicio inigualable de lo que debería ser el periodismo de datos.

El título es sugerente: ¿Cisne negro o pollo del montón? El déficit fiscal catalán en perspectiva. El tema del cisne negro ya ya sido mencionado aquí previamente, aunque mencionarlo en este contexto sólo es posible sometiendo el término a una cierta violencia léxica.

Datos sobre los presupuestos del País Vasco

Quien haya seguido históricamente esta bitácora sabrá que, hablando en plata, cuando me enrollo es para meter caña. Es mi personalidad. Y no es cómodo soportarla.

Como hoy no tengo objeción alguna que hacer en el tema que quiero tratar, seré infinitamente breve. Solo digo: visitad esto.

Un pequeño ejercicio de agudeza visual

Consiste en echarle un vistazo a

y pensar si hay relación entre las variables x e y que aparecen en el gráfico.

Luego, darse cuenta de que corresponden al logaritmo decimal del tamaño de los municipios españoles de más de 1000 habitantes y su deuda por habitante.

Y, finalmente, examinar el título de esta entrada de blog, leerlo si procede, y extraer las conclusiones que uno considere oportunas.

Incendios en España

Quienes siguen de antiguo estas páginas recordarán que ya me ocupé de la cuestión de los incendios forestales hace un tiempo. Después han pasado cosas.

Por un lado, vía Alberto González Paje di con esta página, que utiliza datos del informe estadístico que publica el Ministerio de Medio Ambiente (y de otras cosas más, según la legislatura en cuestión).

También asistí hace un tiempo a una reunión de MediaLab Prado en la que Juan Elosúa nos contó cómo había conseguido acceso a la base de datos completa de incendios del Ministerio a fuerza de insistir y amparado por ciertas normas que garantizan el derecho de los ciudadanos a cualquier tipo de información de tipo medioambiental. Nos mostró, además, algunas visualizaciones que había hecho con ellos.

Tres ideas sobre datos abiertos

  1. Primero, colgar los datos en internet (aunque protegiendo al máximo el derecho a la privacidad).
  2. Segundo, hacerlo en formatos que sean útiles a los desarrolladores, que puedan ser leídos automáticamente a través de APIs.
  3. Tercero, educar a los innovadores y a los emprendedores acerca de la información disponible en la red a través de reuniones de desarrolladores, etc. para que la pongan en valor.

No son mías. Son de Todd Park y están recogidas en este artículo.

No es país para estadísticos

Esto me pasa por madrugar en lunes. Me levanto y me tropiezo con noticias como esta:

Ha sido reproducida en términos similares en otros medios. Es decir, incidiendo en la presunta causalidad de la subida del precio de los medicamentos en la subida del IPC de julio (el índice adelantado; el definitivo se conocerá a mediados de agosto). Sin embargo, la nota de prensa del INE, la única información con la que se cuenta a esta hora y que no incluye desgloses dice textualmente (aunque con mi subrayado):

Deshaucios en España y su estructura geográfica

Participo (de manera muy pasiva) en un foro de periodismo de datos de Barcelona. En él se planteó la posibilidad de desarrollar un proyecto para recopilar información sobre deshaucios y entender mejor este fenómeno.

La iniciativa partió de Carlos Alonso, Concha Catalán y Karma Peiró y, recientemente, Alberto Gonzalez Paje ha cruzado varias bases de datos (como esta, la de la población por provincias del INE, etc.) para crear el material con el que he construido el siguiente gráfico:

Estadística para periodistas en Idescat

Idescat, el instituto de estadística oficial de Cataluña, va a organizar el día 18 de mayo un curso de estadística para periodistas. Sus objetivos son, con mi traducción,

ayudar a entender e interpretar la estadística por jugar un papel importante a la hora de dar un valor añadido a la información que ofrecen [los medios].

Además, se espera que las jornadas se conviertan en un canal de difusión permanente y que se organicen otras en el futuro.

Números rojos (y perfectibles)

El otro día compré un número de Números Rojos. En parte, por curiosidad. En parte, por deformación profesional. Y también porque escribían Peces-Barba, Mayor Zaragoza y algún otro.

Y sé que existen las erratas. Y se puede meter la pata. Pero hay cosas que son imperdonables en un eurodiputado, como parece que lo es el señor Jean-Paul Besset, como confundir el PIB con el PIB per cápita. Efectivamente, existe el Índice de Desarrollo Humano que recoge aspectos que se le escapan a ese otro baremo con que se miden los países, como es el PIB per cápita. Pero si uno quiere cargar las tintas contra este último indicador como línea argumental principal del artículo, bueno es no confundirlo con el PIB total (con mi subrayado):