¿Fascinados por las cosas circulares?

Llevo un tiempo prestando especial atención a los gráficos circulares. Y no me refiero a los innombrables. Hablo más bien de otros como extraído de aquí o que encontré acá. ¿Realmente aporta algo el uso de coordenadas polares? ¿Por qué nos fascinan? ¿Por qué nos resultan tan naturales y familiares? Más aún, ¿abusamos de ellos? ¿Existen alternativas cartesianas más eficaces? Vengo, como digo, prestando atención a los gráficos circulares y planteándome esas preguntas después de leer Our Irresistible Fascination with All Things Circular. Artículo que, por supuesto, invito a hojear.

14 de julio de 2014 · Carlos J. Gil Bellosta

Estrategias escalables (con R)

Hay quienes preguntan cómo cargar con R un csv de 8GB en un portátil de 4GB de RAM. La verdad, he leído respuestas la mar de extravagantes a este tipo de cuestiones: p.e., recomendar SQLite. Yo recomendaría Scalable Strategies for Computing with Massive Data. Entre otras cosas, porque para eso lo escribieron sus autores: para que se lea. Y porque está cargado de razón y buenos consejos. Una cosa con la que tropezará enseguida quien lo hojee es: ...

9 de julio de 2014 · Carlos J. Gil Bellosta

Demasiado bueno para ser cierto

O el porqué de la importancia de los outliers. Hace unos días me presentaron unos datos. Demasiado buenos para ser ciertos. Casi seguro que reflejan un efecto que no es el que se quiere medir. Estaban muy fuera de rango. Leí los 93 folios del informe de Gotham sobre Gowex. Si algo debió llamar la atención de esa gente era que la información pública de Gowex estaba plagada de outliers: consistía en una sistemática comparación de ciertas métricas públicas de la empresa con las de sus competidores. Outliers por doquier. El resto de la historia, conocido: ponerse en corto, publicar y hacer dinero. ...

8 de julio de 2014 · Carlos J. Gil Bellosta

Por qué soy escéptico con respecto al periodismo de datos

Lo dejé dicho hace un tiempo: en algún momento de esta charla expresé mis motivos. Hay iniciativas muy encomiables que abogan por la apertura de datos. Convengo que la disponibilidad de datos de organizaciones púbicas y privadas facilitaría su fiscalización. En particular, la fiscalización que realiza la prensa: su acción sería más eficaz de no tener que jugar al gato y al ratón. Pero hay motivos para el escepticismo. Hay motivos para pensar que la liberación de datos es condición hasta cierto punto necesaria pero en modo alguno suficiente para alcanzar esos loables objetivos. Existen dos contraejemplos rotundos. Se refieren a ámbitos en los que la información es pública, abundante e inmediata y que, además, tienen suma importancia periodística: economía y deportes. ...

7 de julio de 2014 · Carlos J. Gil Bellosta

Vectorización en R: un contraejemplo

No hay regla sin excepción, dicen. Para la recomendación casi única para quienes se quejan de la lentitud de R, es decir, ¡vectoriza!, he encontrado hoy una. Sí, el artículo deja R por los suelos. En el fondo, no tanto, porque viene a decir que R es malo para lo que la documentación de R dice que es malo: véase cómo en Writing R Extensions nos advierten que la convolución is hard to do fast in interpreted R code, but easy in C code. Y el problema que tratan de resolver los autores contiene una convolución (a través de una cadena de Markov, para pasar de un nivel de capital al del siguiente periodo). Es decir, en cierta medida solo viene a confirmar que la documentación de R es buena. ...

4 de julio de 2014 · Carlos J. Gil Bellosta

Nueva versión del informe ‘Quién es Quién en el Big Data en España’

Mis colegas de BigData for Successs acaban de publicar una versión actualizada de su informe Quién es Quién en el Big Data en España. Quien se lo baje —¡muy recomendable!— entenderá por qué les tengo que estar muy agradecido.

3 de julio de 2014 · Carlos J. Gil Bellosta

Hacer amigos vs reponer amigos vs reemplazar amigos

Acaban de escribirme que no, que lo importante no es participar, que no es hacer amigos, que es ¡ganar! Claro que el comentario me llega desde el Cono Sur minutos después de que Argentina gane de manera no muy lucida a Suiza en el Mundial. Pero eso me ha dejado pensando: ¿realmente es positivo hacer amigos? Habiéndome desplazado a un país nuevo en el que de repente me veo rodeado de multitud de adláteres, es algo que me planteo: ¿hago algún amigo? ¿O paso y voy a lo mío? ...

2 de julio de 2014 · Carlos J. Gil Bellosta

Lecturas disparatadas: la salud de los críos y el desempleo

Hay gente que en lugar de escribir cosas debería invertir su tiempo en leer otras. Pero como no me hacen caso, escribiendo cosillas escalan poquito a poco escalafones académicos y, encima, lo pagamos los contribuyentes felizmente engatusados eso del oropel del I+D y nosequé otros intangibles onerosos y de dudosa utilidad pública, podemos hoy disfrutar de otro ejercicio más de ese añejo ritual de la búsqueda del numerito inferior a 0.05 que tiene por título Newborn Health and the Business Cycle: Is it Good to be Born in Bad Times? y que adornará a perpetuidad el currículo de sus ambas autoras. ...

1 de julio de 2014 · Carlos J. Gil Bellosta

Disponible una nueva versión de MicroDatosEs

Acabo de subir a CRAN una nueva versión de MicroDatosEs, un paquete para procesar automáticamente en R ficheros de microdatos públicos españoles. A los cambios y mejoras a los que me referí el otro día, esta nueva versión añade otras, obra de Carlos Neira, que es ahora contribuidor oficial del paquete. Carlos también contribuyó a detectar y corregir un error inducido por el INE, que cambió el formato del fichero introduciendo una nueva variable sin aviso previo. ...

27 de junio de 2014 · Carlos J. Gil Bellosta

APIDays Mediterránea: reunión de los forofos de las APIs de Madrid

Los forofos de las APIs de Madrid están de enhorabuena. El jueves 3 de julio tendrán ocasión de juntarse y celebrar un APIDays Mediterránea informal en MartinaCocina. El resto de la información para los interesados, aquí.

26 de junio de 2014 · Carlos J. Gil Bellosta