Anumerismo en los medios (y seudoperiodismo de datos)

El otro día asistí a un congreso sobre big data, datos públicos, periodismo de datos y ese tipo de cosas. Cuando el panel de periodistas de datos comenzó la rueda de preguntas, estuve por levantar la mano y formular la mía en términos, más o menos, como estos: El periodismo de datos no es algo nuevo. Existen áreas en las que los datos han sido abundantes (incluso en tiempo real) y que llevan siendo cubiertos por la prensa desde hace décadas. Me refiero al sector económico y financiero. Sin embargo, la prensa ha mostrado una capacidad muy pobre para proporcionar análisis y contexto en este ámbito. ¿Qué garantías pueden ofrecernos los nuevos periodistas de datos acerca de su habilidad para para ofrecer análisis sugerentes y profundos en los nuevos ámbitos que se abren en la profesión? ...

14 de noviembre de 2012 · Carlos J. Gil Bellosta

Entrevista en el portal del RUG Barcelona

Ayer salió publicada una entrevista que me hicieron Aleix Ruiz de Villa y Lluís Ramón, del RUG Barcelona (grupo de usuarios de R de Barcelona). Puede leerse íntegramente en este enlace.

13 de noviembre de 2012 · Carlos J. Gil Bellosta

No es país para "biplots"

No, parece que aún no estamos preparados para los biplots. En el curso Introduction to Infographics and Data Visualization de Alberto Cairo, nos pidieron sugierir mejoras y alternativas a este gráfico: En el curso aparecieron sugerencias tales como esta, esta, y otras similares que jugaban con los elementos gráficos habituales con más o menos arte, mejor o peor gusto en los colores, etc. A mí se me ocurrió que los datos que aparecen en el gráfico original podía, con alguna salvedad y abusando del lenguaje, considerarse una especie de tabla de contingencia que incluía el número de personas que en cada país hacen uso de distintos tipos de servicios de internet. Y que entonces podría utilizar herramientas gráficas, tales como los biplots para visualizar los datos. El resultado fue ...

12 de noviembre de 2012 · Carlos J. Gil Bellosta

MapReduce con mincedmeat

Hace unos días implementé un proceso MapReduce usando mincedmeat, un pequeño entorno en Python para desarrollar este tipo de procesos distribuidos. El código y los datos pueden descargarse de este enlace. Los datos de partida están en 249 ficheros de unos 25kb que contienen filas del tipo journals/algorithmica/HarelS98:::David Harel::Meir Sardas:::An Algorithm for Straight-Line of Planar Graphs es decir, publicación, autor (o autores) separados por :: y título de la publicación. Los tres campos están separados por :::. ...

7 de noviembre de 2012 · Carlos J. Gil Bellosta

Tesis de maestría: periodismo de datos, "big data" y "open data"

Tal vez a quienes siguen estas páginas les interese echar un vistazo a la tesis de maestría de Ángeles Mariño. He aquí la introducción: A medida que la información disponible en Internet se ha ido multiplicando, el Periodismo también fue ampliando sus fuentes de información de manera tan relevante que nació una nueva forma de contar historias: el Periodismo de Datos (Data Journalism en inglés), aquel que se basa principal o exclusivamente en bases de datos y documentación en línea para crear una historia. ...

6 de noviembre de 2012 · Carlos J. Gil Bellosta

¿Cómo vivir en un mar de datos?

Pues martes, miércoles y jueves de esta semana voy a tratar de averiguarlo acudiendo a las Primeras jornadas “Vivir en un mar de datos” (del Big Data a la Smart Society) organizados por la Fundación Telefónica. Si alguien se deja caer por allí, que me ubique y nos tomamos un café. (Soy breve: por mi mala cabeza, he acabado apuntado a demasiados cursos de Coursera y otros MOOC a la vez. Y como aragonés, me niego rotundamente a reblar.)

5 de noviembre de 2012 · Carlos J. Gil Bellosta

La crisis es buena para la salud, parece

Ayer leí el artículo Las listas de espera se agravan en El País que parece indicar indirectamente que la crisis tiene efectos beneficiosos para la salud. Leyendo el artículo uno se queda con la copla de que ha crecido tanto el tiempo medio de espera para los tratamientos médicos como el número de personas que los aguardan. Los números pueden verse en el gráfico anterior, extraído del artículo. Lo curioso es que las proporciones son desiguales. ...

31 de octubre de 2012 · Carlos J. Gil Bellosta

Cultura numérica, incultura numérica

Traigo hoy dos enlaces relacionados a mi bitácora. No sé si conocéis OWNI, un Objet Web Non Identifié. Una de sus tres secciones prominentes se llama Cultures Numériques. No datos. No periodismo de datos. No OpenData. Sino culturas numéricas (supongo que el plural es un brindis a la ultracorrección política). Que tal sea el nombre invita a reflexiones que habrían de germinar por sí solas en las mentes de mis lectores. El segundo tiene esta entradilla (con mi traducción): ...

30 de octubre de 2012 · Carlos J. Gil Bellosta

Liberado BioStatFLOSS, una colección de recursos libres para la bioestadística y la epidemiología

Quiero publicitar hoy BioStatFLOSS, una recopilación de software (libre, como el propio nombre indica) para Windows, especialmente indicado a la hora de realizar trabajos en el campo de la bioestadística y la epidemiología (pero que también se puede utilizar para la realización de estudios estadísticos más generales). El software (que incluye R como programa estrella) ha sido portabilizado —si no existía ya una versión portable, es decir, que no necesite instalación— y se ha creado un lanzador común desde donde se puedan llamar a todos esos programas (véase la captura adjunta). Este lanzador está programado en Lazarus (Free Pascal) y, en breve, se liberará el código fuente. ...

29 de octubre de 2012 · Carlos J. Gil Bellosta

HHH, HHT y el comando "yield" de Python

Variable aleatoria X: tiramos una moneda al aire sucesivamente y contamos el número de veces que lo hacemos hasta obtener el patrón HHH (tres caras) en las tres últimas tiradas. Variable aleatoria Y: lo mismo, pero hasta que salga el patrón HHT. Entonces las medias de X e Y son iguales, ¿verdad? Pues no. (¿Alguien sabría decirme cuál de las combinaciones, HHH o HHT, tiende, en promedio, a aparecer antes? Pueden darse explicaciones muy complejas, pero existe una muy simple e intuitiva). ...

26 de octubre de 2012 · Carlos J. Gil Bellosta